訪客叢集可讓您運用客戶特性來動態分類訪客,並根據選取的資料輸入產生叢集,從而識別具有類似興趣和行為的群組,以用於客戶分析和定位。
叢集程式
叢集程式需要您識別要用作輸入的量度和維度元素,並允許您選擇特定的目標群體來套用這些元素來建立指定的叢集。 當您執行叢集程式時,系統會使用度量和維度輸入來決定指定叢集數目的適當初始中心。 然後,這些中心被用作應用K-Means算法的起點。
功能 Maximum Iterations 表中 Options 的分析人員可指定由叢集演算法執行的最大迭代次數。 設定此選項可導致基於最大迭代上限的群集過程更快完成,而犧牲群集中心的精確收斂。
定義群集後,可以保存群集維,以便像其他維一樣使用。 它還可以載入到群集資源管理器中,以檢查群集中心的分離情況。
在「叢集產生器」中,您可以選取 Options >以 Algorithm 在定義叢集時選取演算法。 目前,有3種支援的演算法:
++
執行叢集程式有2種方式:
演算法有下列限制:
在檔 DPU.cfg 案中,「查詢,記憶體限制」的值預設為500 MB。 運行多個群集作業時,必須增加此值。 例如,如果您並行運行5個群集作業,請將此值增加為1 GB。 如果不重新啟動伺服器,就無法取消群集作業。
Recommendations
迭代次數(掃描資料的次數)和您配置的收斂閾值會嚴重影響群集效能。 下表提供您可遵循的更廣泛准則:
叢集數 | 演算法 | 迭代 | 收斂閾值 | 標準化 |
---|---|---|---|---|
6 | Kmeans | 25,50 | 1e-3 | 最小——最大 |
6 | Kmeans | 25,50 | 1e-6 | 最小——最大 |
6 | Kmeans++ | 50 | 1e-6 | 最小——最大 |