ロングテールディメンション項目

大量の一意の値を含むディメンションを使用する場合、ロングテール​というラベルのレポートに値が表示されることがあります。 このディメンション項目は、CJAが使用するレポートアーキテクチャで処理するために含まれる一意の値が多すぎることを意味します。

CJA処理のアーキテクチャと一意の値

CJAは、実行時にレポートを処理し、組み合わせたデータセットを多数のサーバーに配布します。 処理サーバーごとのデータは、ユーザーIDでグループ化されます。つまり、1つの処理サーバーに、特定の人のすべてのデータが含まれます。 処理が完了すると、処理されたデータのサブセットが集約サーバーに渡されます。 処理されたデータのすべてのサブセットは、結合され、ワークスペースレポートの形式で返されます。

データのサブセットを処理する個々のサーバーで500,000個を超える一意のディメンション項目が検出された場合、独自のサブセットの上位500,000個のディメンション項目を返し、「Long Tail」の下の残りを返します。 Workspaceレポートに表示される「ロングテール」ディメンション項目は、500,000個のユニーク値を超えた各処理サーバーの値の集計合計です。

「ロングテール」と「低トラフィック」の違い

以前のバージョンのAnalyticsでは、異なる処理アーキテクチャが使用されていました。 データは収集時に処理されました。 Dimension項目は、ディメンションが500,000個のユニーク値に達し、1M個のユニーク値でより積極的なフィルタリングを適用した後に「低トラフィック」の下に配置されました。 各月の初めにリセットされたユニーク値の数。 処理されたデータは永続的でした。「低トラフィック」から既存のデータを取得する方法はありませんでした。

CJAでは、個々の処理サーバーに500,000個を超える一意の値が含まれる場合にのみ、ディメンション項目が「ロングテール」に格納されます。 処理されたデータは永続的ではありません。つまり、レポートを変更することで、「ロングテール」ディメンション項目を減らすことができます。

「ロングテール」ディメンション項目の削減

「ロングテール」ディメンション項目を減らす場合は、次のいずれかをAdobeにお勧めします。

  • フィルターを使用します。 フィルターは、各サーバーがデータのサブセットを処理するたびに適用されます。 返される一意の値の数を制限すると、「ロングテール」ディメンション項目が減ります。
  • ルックアップデータセットディメンションを使用します。 ルックアップデータセットのディメンションは、イベントデータセットのディメンション項目を組み合わせて、返される一意の値の数を制限します。

全体として、500,000個を超える個別ディメンション項目を含むレポートを使用するのは困難です。 フィルターまたはルックアップデータセットディメンションを適用する場合、レポートを利用しやすくしながら、「ロングテール」の存在を減らすことができます。 Adobeは、CJAの発展に伴い、この経験を改善する計画です。

このページ