選取輸入變數、叢集數目和目標母體(如果需要),以定義資料集中的叢集。
建立叢集
開啟 Cluster Builder.
按一下「視覺效果 > 預測分析 > 叢集 > 叢集產生器」。
選取輸入變數。
從工具列的Metric功能表選取,將量度新增至Input Variables清單。
從Dimension的表格拖曳維度元素,將維度元素新增至Input Variables清單。
按Ctrl + Alt鍵,然後將選定的維元素拖動到工具欄的Input Variables清單或Element框。
依預設,會對整個資料集執行叢集。 您可以在左Preprocessing窗格中看到所有輸入變數。
使用Options功能表來選取所需的叢集數。
如果您想在資料集中叢集訪客的子集,可以定義母體篩選。
首先,使用工作區中的選取項目或使用Filter Editor定義所需的子集。 選取所需的子集後,在Options功能表中設定「目標母體」 。 建議您為目標群組指定識別名稱。
Options菜單還具有控制最大刀路數和中心收斂的可接受閾值的設定。
設定輸入和選項後,按一下Go按鈕以在本機執行叢集,或按Submit將任務傳送至預測分析伺服器。 收斂完成時,提交至伺服器會將產生的維度儲存至資料集。
在本地運行時,你會看到集群生成器在四個樹冠叢集階段中移動,它根據輸入定義智慧中心。
當群集的中心停止更改超過指定的收斂閾值時,群集Dimension就會收斂,群集生成器將顯示有關輸入與每個群集的相關性的其他資訊。
自訂叢集。
按一下右鍵統計資訊的顏色欄會開啟一個上下文菜單,允許您自定義相關性閾值,在維元素分配的情況下,可以選擇顯示哪個測試。
度量輸入為每個簇提供一個t檢驗,而維元素輸入為每個簇提供三個分佈測試(Chi平方、熵U統計和Cramer V統計)。
如果在收斂期間添加或刪除輸入,則進程將暫停,直到再次按Go。
建立叢集後,您可以開啟檢色器,為不同的分佈結果指派顏色。
叢集Dimension聚合後,您可以將量度新增至表格,並正常進行選取。 您也可以以滑鼠右鍵按一下元素名稱(叢集1、叢集2等),開啟內容功能表,將其重新命名為更有意義的名稱。
如果您想在其他視覺效果中使用此叢集維度,可以在本機Save或將其Submit用於伺服器。
如果您想要再次運行收斂,或查看輸入的相關性,則群集生成器還可載入現有群集維。
選取後,Reset將完全釋放所有輸入變數,並提供空白的叢集產生器視覺效果以定義新叢集。