多数の一意の値を含むディメンションを使用する場合、レポートにロングテールというラベルの付いた値が表示されることがあります。このディメンション項目は、CJA が使用しているレポートアーキテクチャに一意の値が多すぎて処理できないことを意味します。
CJA は、レポートが実行された時点でその処理を行い、結合されたデータセットを複数のサーバーに配信します。処理サーバーごとのデータは、ユーザー ID でグループ化されます。つまり、1 つの処理サーバーに特定のユーザーのすべてのデータが含まれます。処理が完了すると、処理済みのデータのサブセットが集約サーバーに渡されます。処理されたデータのすべてのサブセットは、結合され、Workspace レポートの形式で返されます。
データのサブセットを処理する個々のサーバーが 500,000 個を超える一意のディメンション項目を検出した場合、そのサーバーはサブセットの上位 500,000 個のディメンション項目を返し、残りを「ロングテール」の下に返します。Workspace レポートに表示される「ロングテール」ディメンション項目は、一意の値が 500,000 個を超えた個々の処理サーバーの値の集計値です。
以前のバージョンの Analytics では、異なる処理アーキテクチャが使用されていました。データは収集時に処理されました。ディメンション項目は、ディメンションが 500,000 個の一意の値に達した後、「低トラフィック」の下に配置され、1,000,000 個の一意の値でより積極的なフィルタリングを適用しました。一意の値のカウントは、毎月の初めにリセットされました。処理されたデータは永続的でした。「低トラフィック」から既存のデータを取得する方法はありませんでした。
CJA では、個々の処理サーバーに 500,000 個を超える一意の値が含まれている場合にのみ、ディメンション項目が「ロングテール」に配置されます。処理されたデータは永続的ではありません。つまり、レポートを変更することで、「ロングテール」ディメンション項目を減らすことができます。
「ロングテール」ディメンション項目を減らす場合は、次のいずれかをお勧めします。
全体として、500,000 個を超える一意のディメンション項目を含むレポートを使用することは困難です。フィルターまたはルックアップデータセットディメンションを適用すれば、レポートをより使用しやすくしながら、「ロングテール」の存在を抑えることができます。アドビは、CJA のさらなる開発に伴い、このエクスペリエンスを改善する予定です。