訪問者クラスタリング

訪問者クラスタリングを使用すると、顧客の特徴を活用して訪問者を動的に分類し、選択したデータ入力に基づいてクラスターセットを生成できます。そのため、興味や行動が似ているグループを特定し、顧客分析とターゲティングに活かすことができます。

クラスタリング処理

クラスタリング処理では、入力として使用する指標とディメンションエレメントを指定する必要があります。特定のターゲット母集団を選択し、これらのエレメントを適用して、指定したクラスターを作成できます。クラスタリング処理を実行すると、指標とディメンションの入力を使用して、指定された数のクラスターに適した初期中心が決定されます。これらの中心は、K 平均アルゴリズムを適用するための起点として使用されます。

  • キャノピークラスタリングパスによって初期中心がインテリジェントに選択されます。
  • すべてのデータポイントを最も近い中心に関連付けることで、データクラスターが作成されます。
  • K クラスターのそれぞれの平均が新しい中心となります。
  • 収束に達するまで、アルゴリズムの手順 2 と 3 が繰り返されます。これは複数のパスを取る場合があります。

The Maximum Iterations in the Options menu allows the analyst to specify the maximum number of iterations to be performed by the clustering algorithm. このオプションを設定すると、クラスター中心の正確な収束を犠牲にして、最大反復数に基づいてクラスタリング処理を迅速に完了できます。

メモ

クラスターが定義されると、他のディメンションと同様に、クラスターディメンションを保存して使用できます。 クラスターディメンションをクラスターエクスプローラーに読み込んで、クラスターの中心の距離を調べることもできます。

In the Cluster Builder, you can select Options > Algorithm to select algorithms when defining clusters. 現在、3つのアルゴリズムがサポートされています。

  • KMeans
  • Kmeans++
  • 期待値最大化

クラスタリング処理を実行する方法は2つあります。

  • 方法1 — クラスターのビジュア Go ライゼーションウィンドウでをクリックします。
  • 方法2 — クラスターのビジュ Submit アライゼーションウィンドウ内をクリックします。このウィンドウで、クラスタリングジョブがサーバーに直接送信されます。 「クエリーの詳細なステータス」オプションを使用して、進行状況を追跡できます。

アルゴリズムには、次の制限があります。

  1. 方法1を使用している場合は、サポートされているクラスタリングアルゴリズムを選択できます。
  2. メソッド2を使用している場合は、kmeansまたはkmeans++を選択できます。 「期待値の最大化」オプションは使用できません。
メモ

ファイル DPU.cfg 内で、「Query, Memory Limit」の値は、デフォルトで500 MBに設定されています。 この値は、複数のクラスタリングジョブの実行中に増やす必要があります。 例えば、5つのクラスタリングジョブを並行して実行する場合は、この値を1 GBに増やします。 サーバーを再起動しない限り、クラスタリングジョブをキャンセルする方法はありません。

推奨事項

繰り返し回数(データがスキャンされる回数)と設定した収束しきい値は、クラスタリングのパフォーマンスに大きく影響します。 次の表に、従うことのできるより幅広いガイドラインを示します。

クラスター数 アルゴリズム 反復 収束しきい値 正規化
6 Kmean 25,50 1e-3 最小 — 最大
6 Kmean 25,50 1e-6 最小 — 最大
6 Kmeans++ 50 1e-6 最小 — 最大

このページ