訪問者クラスタリング

重要

Data Workbench 提供終了のお知らせ.

訪問者クラスタリングを使用すると、顧客の特徴を活用して訪問者を動的に分類し、選択したデータ入力に基づいてクラスターセットを生成できます。そのため、興味や行動が似ているグループを特定し、顧客分析とターゲティングに活かすことができます。

クラスタリング処理

クラスタリング処理では、入力として使用する指標とディメンションエレメントを指定する必要があります。特定のターゲット母集団を選択し、これらのエレメントを適用して、指定したクラスターを作成できます。クラスタリング処理を実行すると、指標とディメンションの入力を使用して、指定された数のクラスターに適した初期中心が決定されます。これらの中心は、K 平均アルゴリズムを適用するための起点として使用されます。

  • キャノピークラスタリングパスによって初期中心がインテリジェントに選択されます。
  • すべてのデータポイントを最も近い中心に関連付けることで、データクラスターが作成されます。
  • K クラスターのそれぞれの平均が新しい中心となります。
  • 収束に達するまで、アルゴリズムの手順 2 と 3 が繰り返されます。これは複数のパスを取る場合があります。

この Maximum IterationsOptions メニューを使用すると、クラスタリングアルゴリズムで実行する反復の最大数を指定できます。 このオプションを設定すると、クラスター中心の正確な収束を犠牲にして、最大反復数に基づいてクラスタリング処理を迅速に完了できます。

メモ

クラスターが定義されたら、クラスターDimensionを保存して、他のディメンションと同様に使用できます。 クラスターディメンションをクラスターエクスプローラーに読み込んで、クラスターの中心の距離を調べることもできます。

クラスタービルダーで、 Options > Algorithm :クラスターを定義する際にアルゴリズムを選択します。 現在、次の 3 つのアルゴリズムがサポートされています。

  • KMeans
  • Kmeans++
  • 期待の最大化

クラスタリング処理を実行する方法は 2 つあります。

  • 方法 1 — クリック Go 「クラスターのビジュアライゼーション」ウィンドウで使用します。
  • 方法 2 — クリック Submit クラスターのビジュアライゼーションウィンドウで、クラスタリングジョブをサーバーに直接送信します。 「クエリの詳細ステータス」オプションを使用して、進行状況を追跡できます。

アルゴリズムには次の制限があります。

  1. メソッド 1 を使用している場合は、サポートされているクラスタリングアルゴリズムを選択できます。
  2. メソッド 2 を使用している場合は、kmean または kmeans++を選択できます。 「期待値の最大化」オプションは使用できません。
メモ

内 DPU.cfg ファイルの場合、「Query, Memory Limit」の値はデフォルトで 500 MB に設定されています。 この値は、複数のクラスタリングジョブを実行する際に増やす必要があります。 例えば、5 つのクラスタリングジョブを並行して実行する場合は、この値を 1 GB に増やします。 サーバーを再起動しない限り、クラスタリングジョブをキャンセルする方法はありません。

推奨事項

反復数(データがスキャンされた回数)と設定した収束しきい値は、クラスタリングのパフォーマンスに大きく影響します。 次の表に、従うことのできるより広いガイドラインを示します。

クラスター数 アルゴリズム 反復 収束しきい値 正規化
6 Kmeans 25,50 1e-3 最小 — 最大
6 Kmeans 25,50 1e-6 最小 — 最大
6 Kmeans++ 50 1e-6 最小 — 最大

このページ