訪問者クラスタリングを使用すると、顧客の特徴を活用して訪問者を動的に分類し、選択したデータ入力に基づいてクラスターセットを生成できます。そのため、興味や行動が似ているグループを特定し、顧客分析とターゲティングに活かすことができます。
クラスタリング処理
クラスタリング処理では、入力として使用する指標とディメンションエレメントを指定する必要があります。特定のターゲット母集団を選択し、これらのエレメントを適用して、指定したクラスターを作成できます。クラスタリング処理を実行すると、指標とディメンションの入力を使用して、指定された数のクラスターに適した初期中心が決定されます。これらの中心は、K 平均アルゴリズムを適用するための起点として使用されます。
OptionsメニューのMaximum Iterationsを使用すると、分析者はクラスタリングアルゴリズムで実行する反復の最大回数を指定できます。 このオプションを設定すると、クラスター中心の正確な収束を犠牲にして、最大反復数に基づいてクラスタリング処理を迅速に完了できます。
クラスターを定義したら、クラスターDimensionを保存して、他のディメンションと同様に使用できます。 クラスターディメンションをクラスターエクスプローラーに読み込んで、クラスターの中心の距離を調べることもできます。
クラスタービルダーでは、クラスターを定義する際に、Options/Algorithmを選択してアルゴリズムを選択できます。 現在、3つのサポートされるアルゴリズムがあります。
++
クラスタリング処理を実行する方法は2つあります。
アルゴリズムには、次の制限があります。
DPU.cfgファイルでは、「クエリ、メモリ制限」の値は、デフォルトで500 MBに設定されています。 この値は、複数のクラスタリングジョブを実行する際に増やす必要があります。 例えば、5つのクラスタリングジョブを並行して実行する場合は、この値を1 GBに増やします。 サーバーを再起動しない限り、クラスタリングジョブを取り消すことはできません。
推奨事項
反復回数(データがスキャンされる回数)と設定した収束のしきい値は、クラスタリングのパフォーマンスに大きく影響します。 次の表に、従うことのできるより幅広いガイドラインを示します。
クラスター数 | アルゴリズム | 反復 | 収束のしきい値 | 正規化 |
---|---|---|---|---|
6 | Kmean | 25,50 | 1e-3 | 最小 — 最大 |
6 | Kmean | 25,50 | 1e-6 | 最小 — 最大 |
6 | Kmeans++ | 50 | 1e-6 | 最小 — 最大 |