Data Workbench 提供終了のお知らせ.
訪問者クラスタリングを使用すると、顧客の特徴を活用して訪問者を動的に分類し、選択したデータ入力に基づいてクラスターセットを生成できます。そのため、興味や行動が似ているグループを特定し、顧客分析とターゲティングに活かすことができます。
クラスタリング処理
クラスタリング処理では、入力として使用する指標とディメンションエレメントを指定する必要があります。特定のターゲット母集団を選択し、これらのエレメントを適用して、指定したクラスターを作成できます。クラスタリング処理を実行すると、指標とディメンションの入力を使用して、指定された数のクラスターに適した初期中心が決定されます。これらの中心は、K 平均アルゴリズムを適用するための起点として使用されます。
この Maximum Iterations 内 Options メニューを使用すると、クラスタリングアルゴリズムで実行する反復の最大数を指定できます。 このオプションを設定すると、クラスター中心の正確な収束を犠牲にして、最大反復数に基づいてクラスタリング処理を迅速に完了できます。
クラスターが定義されたら、クラスターDimensionを保存して、他のディメンションと同様に使用できます。 クラスターディメンションをクラスターエクスプローラーに読み込んで、クラスターの中心の距離を調べることもできます。
クラスタービルダーで、 Options > Algorithm :クラスターを定義する際にアルゴリズムを選択します。 現在、次の 3 つのアルゴリズムがサポートされています。
++
クラスタリング処理を実行する方法は 2 つあります。
アルゴリズムには次の制限があります。
内 DPU.cfg ファイルの場合、「Query, Memory Limit」の値はデフォルトで 500 MB に設定されています。 この値は、複数のクラスタリングジョブを実行する際に増やす必要があります。 例えば、5 つのクラスタリングジョブを並行して実行する場合は、この値を 1 GB に増やします。 サーバーを再起動しない限り、クラスタリングジョブをキャンセルする方法はありません。
推奨事項
反復数(データがスキャンされた回数)と設定した収束しきい値は、クラスタリングのパフォーマンスに大きく影響します。 次の表に、従うことのできるより広いガイドラインを示します。
クラスター数 | アルゴリズム | 反復 | 収束しきい値 | 正規化 |
---|---|---|---|---|
6 | Kmeans | 25,50 | 1e-3 | 最小 — 最大 |
6 | Kmeans | 25,50 | 1e-6 | 最小 — 最大 |
6 | Kmeans++ | 50 | 1e-6 | 最小 — 最大 |