訪問者クラスタリング

訪問者クラスタリングを使用すると、顧客の特徴を活用して訪問者を動的に分類し、選択したデータ入力に基づいてクラスターセットを生成できます。そのため、興味や行動が似ているグループを特定し、顧客分析とターゲティングに活かすことができます。

クラスタリング処理

クラスタリング処理では、入力として使用する指標とディメンションエレメントを指定する必要があります。特定のターゲット母集団を選択し、これらのエレメントを適用して、指定したクラスターを作成できます。クラスタリング処理を実行すると、指標とディメンションの入力を使用して、指定された数のクラスターに適した初期中心が決定されます。これらの中心は、K 平均アルゴリズムを適用するための起点として使用されます。

  • キャノピークラスタリングパスによって初期中心がインテリジェントに選択されます。
  • すべてのデータポイントを最も近い中心に関連付けることで、データクラスターが作成されます。
  • K クラスターのそれぞれの平均が新しい中心となります。
  • 収束に達するまで、アルゴリズムの手順 2 と 3 が繰り返されます。これは複数のパスを取る場合があります。

Options​メニューの​Maximum Iterations​を使用すると、アナリストは、クラスタリングアルゴリズムによって実行される反復の最大回数を指定できます。 このオプションを設定すると、クラスター中心の正確な収束を犠牲にして、最大反復数に基づいてクラスタリング処理を迅速に完了できます。

メモ

クラスターが定義されたら、クラスターDimensionを保存して、他のディメンションと同じように使用できます。 クラスターディメンションをクラスターエクスプローラーに読み込んで、クラスターの中心の距離を調べることもできます。

クラスタービルダーでは、Options > Algorithm​を選択して、クラスターを定義する際にアルゴリズムを選択できます。 現在、次の3つのアルゴリズムがサポートされています。

  • KMeans
  • Kmeans++
  • 期待最大化

クラスタリング処理を実行する方法は2つあります。

  • 方法1 — クラスターのビジュアライゼーションウィンドウで​Go​をクリックします。
  • 方法2 — クラスターのビジュアライゼーションウィンドウで​Submit​をクリックします。このウィンドウでは、クラスタリングジョブがサーバーに直接送信されます。 「クエリの詳細ステータス」オプションを使用して、進行状況を追跡できます。

アルゴリズムには次の制限があります。

  1. メソッド1を使用している場合は、サポートされているクラスタリングアルゴリズムを選択できます。
  2. メソッド2を使用している場合は、kmeanまたはkmeans++を選択できます。 「期待値の最大化」オプションは使用できません。
メモ

DPU.cfgファイルでは、「Query, Memory Limit」の値はデフォルトで500 MBに設定されています。 複数のクラスタリングジョブを実行する際に、この値を増やす必要があります。 例えば、5つのクラスタリングジョブを並行して実行する場合は、この値を1 GBに増やします。 サーバーを再起動しない限り、クラスタリングジョブをキャンセルする方法はありません。

推奨事項

繰り返し回数(データがスキャンされた回数)と設定した収束しきい値は、クラスタリングのパフォーマンスに大きく影響します。 次の表に、従うことのできるより広範なガイドラインを示します。

クラスタ数 アルゴリズム 反復 収束のしきい値 正規化
6 Kmean 25,50 1e-3 Min-Max
6 Kmean 25,50 1e-6 Min-Max
6 Kmean++ 50 1e-6 Min-Max

このページ