ロングテール分析コード項目

大量の一意の値を含むディメンションを使用する場合、ロングテール​というラベルの付いたレポートーに値が表示されることがあります。 このディメンション項目は、レポートアーキテクチャCJAが使用する一意の値が多すぎて処理できないことを意味します。

CJA処理のアーキテクチャと固有の値

CJAは、レポートの実行時にそのレポートを処理し、組み合わせたデータセットを複数のサーバに配信します。 処理サーバーごとのデータは、個人IDでグループ化されます。つまり、1つの処理サーバーに特定の人のすべてのデータが含まれます。 処理が終了すると、処理済みデータのサブセットがアグリゲータサーバに渡されます。 処理されたデータのサブセットはすべて結合され、ワークスペースレポートの形式で返されます。

データのサブセットを処理する個々のサーバーが500,000個を超える一意のディメンション項目に遭遇した場合、そのサブセットの上位500,000個のディメンション項目を返し、残りの値を'Long Tail'に返します。 ワークスペースレポートに表示される「ロングテール」ディメンション項目は、500K個の固有値を超えた個々の処理サーバーの値の合計です。

「ロングテール」と「低トラフィック」の違い

Adobe Analyticsの以前のバージョンでは、異なる処理アーキテクチャが使用されていました。 データは収集時に処理されました。 ディメンションが500,000個の固有値に達し、1M個の固有値でよりアグレッシブなフィルタリングを適用した後に、Dimension項目が「低トラフィック」の下に配置されました。 各カレンダー月の最初に、一意の値の数がリセットされました。 処理されたデータは永久的でした。「低トラフィック」から既存のデータを取得する方法はありません。

CJAでは、個々の処理サーバーに500,000個を超える固有値が含まれている場合にのみ、ディメンション項目が「ロングテール」に入力されます。 処理されたデータは永久的ではありません。つまり、レポートを変更することで、「ロングテール」ディメンション項目を減らすことができます。

'ロングテール'ディメンション項目の削減

'ロングテール'ディメンション項目を減らす場合は、Adobeが次のいずれかを推奨します。

  • フィルターを使用します。 フィルターは、各サーバがデータのサブセットを処理するときに適用されます。 返される一意の値の数を制限すると、ディメンション項目「ロングテール」が減少します。
  • ルックアップデータセットディメンションを使用します。 ルックアップデータセットのディメンションは、イベントデータセットのディメンション項目を組み合わせたもので、返される一意の値の数を制限します。

全体として、500,000個を超える個別ディメンション項目を含むレポートを使用するのは困難です。 フィルターまたはルックアップデータセットディメンションを適用する場合、「ロングテール」の存在を減らしながら、レポートで消費しやすくすることができます。 CJAの発展に伴い、Adobeはこの体験を改善する予定です。

このページ

Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now