Customer Data Feed(CDF)ファイルに関する基本情報と導入方法の説明です。CDFファイルの受信に関心がある場合や詳細を知りたい場合は、ここから始めてください。
CDF ファイルには、Audience Manager イベント呼び出し(/event
)でサーバーに送信されるデータと同じものが含まれています。ユーザー ID、trait IDs、segment IDs など、イベント呼び出しで表されるあらゆるパラメーターが含まれます。Audience Manager の内部システムがイベントデータを処理して CDF ファイルを生成します。このファイルの内容は、所定の順序で出現するフィールドで構成されます。Audience Manager は、時間ごとに CDF ファイルの生成を試み、Amazon S3 サーバー上のセキュリティで保護された顧客専用バケットにファイルを保存します。これらのファイルが提供されているのは、ユーザーインターフェイス上の制限を受けずに Audience Manager データを扱えるようにするためです。
CDF ファイルを使用する場合は、次の制限事項に注意してください。
CDFファイル配信を開始するためのセルフサービスプロセスはありません。開始するには、担当の Audience Manager コンサルタントまたはカスタマーケアに問い合わせてください。実装時に Audience Manager 担当者は以下をおこないます。
ファイルのダウンロード準備ができたら、ファイル通知と CDF ファイルが S3 バケットに表示されます。割り当てられた S3 ディレクトリ内のファイルの監視やダウンロードは、ユーザー自身がおこないます。顧客データフィードファイル処理の通知。
このサービスの詳細については、以下の節および顧客データフィードの FAQ を参照してください。
CDFファイルのデータ要素および配列を出現順に列挙し定義します。定義にはデータタイプが含まれていますが、この情報は CDF ファイルには含まれていません。
CDF ファイルには、以下に定義するフィールドの一部または全部が含まれています。内部ファイル組織について詳しくは、顧客データフィードファイルの構造を参照してください。
フィールド | データタイプ | 説明 |
---|---|---|
|
タイムスタンプ |
データ収集サーバー(DCS)で CDF ファイルが処理された時刻。タイムスタンプは yyyy-mm-dd hh:mm:ss 形式を使用し、UTC タイムゾーンに設定されます。
注意:イベント時刻は、
|
|
文字列 |
これは一意のユーザー ID(UUID)で、サイト訪問者の 38 桁のデバイス ID です。Audience Manager の ID のインデックスも参照してください。 |
|
数値 |
ID の同期を起動するコンテナの ID。 |
|
数値配列 |
イベント呼び出しで訪問者が満足した(基準を満たした)特性がすべて含まれている特性 ID 配列。 この配列には、訪問者が以前に絞り込まれた特性と、このイベント呼び出しを通じて再度絞り込まれる特性が含まれる可能性があることに注意してください。 |
|
数値配列 |
イベント呼び出しで訪問者が満足した(基準を満たした)セグメントがすべて含まれているセグメント ID 配列。 |
|
文字列 |
イベント呼び出しで渡される、すべてのパラメーター(変数、ID、キー値ペア、デバイス広告 ID など)を取り込む文字列。 短縮化した例: |
|
文字列 |
参照元ページのエンコードされていない URL(参照元ページがある場合)。 |
|
文字列 |
イベント呼び出しで表現された訪問者の IP アドレス。 |
|
文字列 |
サイト訪問者に割り当てられた Experience Cloud ID(MID)。Cookie と Adobe Experience Platform ID サービスも参照してください。 |
|
数値配列 |
訪問者が以前に基準を満たしたセグメントと新たに絞り込まれるセグメントを含んだセグメント ID 配列。 |
|
数値配列 |
以前に認識された特性と、最後のデータフィード生成以降に訪問者が認定された新しい特性を含むファーストパーティおよびサードパーティ特性 ID の配列。 |
CDF ファイルのデータ構造を一覧表示および定義します。データ列、フィールド区切り文字、データファイルマップ、サンプルファイルが含まれています。
CDF ファイルには、ラベル付きの列やフィールドヘッダーは含まれていません。代わりに、CDF ファイルでは非表示の ASCII 文字でフィールドと配列を定義します。また、CDF ファイルでは各フィールドと配列が特定の順序で並んでいます。フィールドの識別子と順序を理解すると、ファイルを適切に解析するうえで役に立ちます。
CDF ファイル要素 | 説明 |
---|---|
フィールド区切り文字 |
次の非表示文字で CDF ファイルの要素と構造が定義されます。
|
フィールド列 |
重要:Audience Manager は、今後のリリースで CDF ファイルの末尾に新規フィールドを追加する権利を留保します。つまり、ファイル解析システムの技術設計では、(既存の列については固定した順序を想定してもかまいませんが)固定した列数を前提としないでください。 CDF ファイル内のデータの順序は次のとおりです。これらのフィールドの代わりに、null 値を表す /N が表示される場合があります。
フィールドの説明については、 顧客データフィードコンテンツの定義を参照してください。 |
CDF ファイルデータの出現順序は以下のとおりです。
CDF ファイル内の配列は Ctrl + a
フィールド区切り文字で始まり、同じ区切り文字で終わります。これにより、配列の先頭要素は単独のデータフィールドのように見えます。例えば、適合済みtraitsの配列は ^A1234
で始まります。このエントリの後に、配列の区切り文字と ID ^B5678
が続きます。そのため、(^B
で始まっているので)適合済みtraitsの配列の先頭要素が ID 5678 であると考えてしまうかもしれません。しかし、実際にはそうではありません。だからこそ、データファイルのデータ列と構造に熟知する必要があるのです。適合済みtraitの配列(または CDF ファイルに含まれている他の任意の配列)の先頭要素が ^A
で始まっている場合であっても、ファイル内の出現順序や位置によって配列の開始が決まります。また、配列の先頭要素は必ず ^A
で先行エントリと区切られます。
サンプル CDF ファイルは例えば次のようになります。このサンプルには、ページに合わせて改行が挿入されています。
CDF ファイル名の構成要素を次の表に列挙し定義します。
典型的な CDF ファイル名は以下の要素で構成されています。なお、斜体の部分には実際の情報が入ります。
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
S3 ストレージバケットでは、ファイルはパートナー ID(PID)、日、時で昇順にソートされます。
CDF ファイル名の構成要素を次の表に列挙し定義します。
ファイル名要素 | 説明 |
---|---|
|
Amazon S3 サーバーで CDF ファイルに使用されるデフォルトのルートストレージバケット。 |
|
CDF ファイルを格納する読み取り専用の S3 バケットの名前。 |
|
ファイルが処理された日付。 |
|
UTC タイムゾーンに設定された 24 時間表記の時刻値。詳しくは、顧客データフィードファイル名の時刻とファイルコンテンツの時刻の違いを参照してください。 |
|
ユーザーのパートナー ID。 |
|
ファイルシーケンスを識別する値。 シーケンスは、0_0_0、0_1_0、0_2_0....1_0_0 といったように増分されます。 |
|
gzip ファイルの拡張子。CDF ファイルは gzip で圧縮されています。 |
Audience Manager は、ファイルのダウンロード準備が完了したことを知らせるために、Customer Data File(CDF)のダウンロード準備ができたことを知らせるために、S3 ディレクトリに .info
ファイルを書き込みます。.info
ファイルには、CDF ファイルの内容に関する JSON 形式のメタデータも含まれています。この通知ファイルで使用されている構文やフィールドについては、このセクションで確認してください。
各 .info
ファイルは、Files
と Totals
の 2 つのセクションで構成されます。Files
セクションには、時間ごとのファイルの特定の指標を格納した配列が含まれています。Totals
セクションには、特定の日のすべての CDF ファイルについて集計した指標が含まれています。.info
ファイルの内容は、例えば次のようになります。
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
以下の表に、CDF .info
ファイルの構成要素の一覧と説明を示します。
フィールド | 説明 |
---|---|
|
CDF ファイルに関するメタデータを含んだ配列が、この後に始まります。 |
|
ファイルサイズ(バイト単位)。 |
|
Amazon S3 の ETag。ハイフンの後の数字は、マルチパートアップロードの際にファイルの作成に使用されたパートの数を示します。 |
|
ファイル名。詳しくは、 顧客データフィードファイルの命名規則を参照してください。 |
|
各ファイルのインデックス番号。 |
フィールド | 説明 |
---|---|
|
すべての CDF ファイルに関する集計データを含んだオブジェクトが、この後に始まります。 |
|
データが得られた日。yyyy-mm-dd 形式で表されます。 |
|
データが得られた時刻(時)。UTC タイムゾーンに設定された 24 時間形式で表されます。 |
|
その日時のすべての CDF ファイルの合計サイズ(バイト単位)。 |
|
S3 ディレクトリにアップロードされたファイルの総数。 |
CDF ファイルでは、ファイル名とファイルコンテンツにタイムスタンプが含まれています。これらのタイムスタンプは、同じ CDF ファイルに対する異なるイベントプロセスを記録します。同じファイルの名前とコンテンツに異なるタイムスタンプが表示されることは珍しくありません。各タイムスタンプを理解すると、このデータを操作したり時刻でソートしようとしたりするときに、犯しがちなミスを避けるうえで役に立ちます。
CDF ファイルでは、2 つの別個の場所に異なる時刻を記録します。
CDF ファイルのタイムスタンプの詳細とそれらの適切な使い方を次の表に示します。
タイムスタンプの場所 | 説明 |
---|---|
ファイル名 | CDF ファイル名に含まれているタイムスタンプは、Audience Manager がファイルの配信準備を開始した時刻を示します。このタイムスタンプは UTC タイムゾーンに設定されています。hour= パラメーターを使用しており、時刻は 24 時間表記の 2 桁の時で表されています。この時刻は、ファイルコンテンツに記録されているイベント時刻とは異なることがあります。CDF ファイルを処理する際、特定の時間で S3 バケットが空となることに気付く場合があります。バケットが空になるのは、次のいずれかの場合が考えられます。
重要:ファイル名のタイムスタンプを使用して、イベントを時間別にグループ化しないでください。時間別にグループ化する必要がある場合は、ファイルコンテンツの EventTime タイムスタンプを使用します。 |
ファイルコンテンツ | CDF ファイルコンテンツに含まれているタイムスタンプは、Data Collection Servers がファイルの処理を開始した時刻を示します。このタイムスタンプは UTC タイムゾーンに設定されています。EventTime フィールドを使用し、時刻は yyyy-mm-dd hh:mm:ss 形式で表されます。この時刻は、ページ上のイベントの実際の時刻に近いものの、ファイル名に示される時刻とは異なることがあります。ヒント:ファイル名の hour= タイムスタンプとは異なり、EventTime を使用してデータを時間別にグループ化することができます。 |