建立叢集

選取輸入變數、叢集數目和目標母體(如果需要),以定義資料集中的叢集。

建立叢集

  1. 開啟 Cluster Builder.

    按一下「視覺效果 > 預測分析 > 叢集 > 叢集產生器」。

  2. 選取輸入變數。

    • 從工具列的​Metric​功能表選取,將量度新增至​Input Variables​清單。

    • 從Dimension的表格拖曳維度元素,將維度元素新增至​Input Variables​清單。

      按​Ctrl + Alt​鍵,然後將選定的維元素拖動到工具欄的​Input Variables​清單或​Element​框。


      依預設,會對整個資料集執行叢集。 您可以在左​Preprocessing​窗格中看到所有輸入變數。

  3. 使用​Options​功能表來選取所需的叢集數。

  4. 如果您想在資料集中叢集訪客的子集,可以定義母體篩選。

    首先,使用工作區中的選取項目或使用​Filter Editor​定義所需的子集。 選取所需的子集後,在​Options​功能表中設定「目標母體」 。 建議您為目標群組指定識別名稱。

    Options​菜單還具有控制最大刀路數和中心收斂的可接受閾值的設定。

  5. 設定輸入和選項後,按一下​Go​按鈕以在本機執行叢集,或按​Submit​將任務傳送至預測分析伺服器。 收斂完成時,提交至伺服器會將產生的維度儲存至資料集。

    在本地運行時,你會看到集群生成器在四個樹冠叢集階段中移動,它根據輸入定義智慧中心。

    當群集的中心停止更改超過指定的收斂閾值時,群集Dimension就會收斂,群集生成器將顯示有關輸入與每個群集的相關性的其他資訊。

  6. 自訂叢集。

    按一下右鍵統計資訊的顏色欄會開啟一個上下文菜單,允許您自定義相關性閾值,在維元素分配的情況下,可以選擇顯示哪個測試。

    度量輸入為每個簇提供一個t檢驗,而維元素輸入為每個簇提供三個分佈測試(Chi平方、熵U統計和Cramer V統計)。

    注意

    如果在收斂期間添加或刪除輸入,則進程將暫停,直到再次按​Go

    建立叢集後,您可以開啟檢色器,為不同的分佈結果指派顏色。

  7. 叢集Dimension聚合後,您可以將量度新增至表格,並正常進行選取。 您也可以以滑鼠右鍵按一下元素名稱(叢集1、叢集2等),開啟內容功能表,將其重新命名為更有意義的名稱。

  8. 如果您想在其他視覺效果中使用此叢集維度,可以在本機​Save​或將其​Submit​用於伺服器。

如果您想要再次運行收斂,或查看輸入的相關性,則群集生成器還可載入現有群集維。

秘訣

選取後,Reset​將完全釋放所有輸入變數,並提供空白的叢集產生器視覺效果以定義新叢集。

本頁內容