大量の一意の値を含むディメンションを使用する場合、ロングテールというラベルの付いたレポートーに値が表示されることがあります。 このディメンション項目は、レポートアーキテクチャCJAが使用する一意の値が多すぎて処理できないことを意味します。
CJAは、レポートの実行時にそのレポートを処理し、組み合わせたデータセットを複数のサーバに配信します。 処理サーバーごとのデータは、個人IDでグループ化されます。つまり、1つの処理サーバーに特定の人のすべてのデータが含まれます。 処理が終了すると、処理済みデータのサブセットがアグリゲータサーバに渡されます。 処理されたデータのサブセットはすべて結合され、ワークスペースレポートの形式で返されます。
データのサブセットを処理する個々のサーバーが500,000個を超える一意のディメンション項目に遭遇した場合、そのサブセットの上位500,000個のディメンション項目を返し、残りの値を'Long Tail'に返します。 ワークスペースレポートに表示される「ロングテール」ディメンション項目は、500K個の固有値を超えた個々の処理サーバーの値の合計です。
Adobe Analyticsの以前のバージョンでは、異なる処理アーキテクチャが使用されていました。 データは収集時に処理されました。 ディメンションが500,000個の固有値に達し、1M個の固有値でよりアグレッシブなフィルタリングを適用した後に、Dimension項目が「低トラフィック」の下に配置されました。 各カレンダー月の最初に、一意の値の数がリセットされました。 処理されたデータは永久的でした。「低トラフィック」から既存のデータを取得する方法はありません。
CJAでは、個々の処理サーバーに500,000個を超える固有値が含まれている場合にのみ、ディメンション項目が「ロングテール」に入力されます。 処理されたデータは永久的ではありません。つまり、レポートを変更することで、「ロングテール」ディメンション項目を減らすことができます。
'ロングテール'ディメンション項目を減らす場合は、Adobeが次のいずれかを推奨します。
全体として、500,000個を超える個別ディメンション項目を含むレポートを使用するのは困難です。 セグメントまたはルックアップデータセットディメンションを適用する場合、「ロングテール」の存在を減らしながら、レポートで消費しやすくすることができます。 CJAの発展に伴い、Adobeはこの体験を改善する予定です。