Grundlegende Informationen Customer Data Feed (CDF) Dateien und Anweisungen zu den ersten Schritten. Beginnen Sie hier, wenn Sie Interesse haben CDF oder Sie benötigen einfach weitere Informationen.
Eine CDF-Datei enthält dieselben Daten, die ein Audience Manager-Ereignisaufruf (/event
) an unsere Server sendet. Dazu gehören Daten wie Benutzer-IDs, trait IDs, segment IDsund alle anderen Parameter, die von einem Ereignisaufruf erfasst werden. intern Audience Manager Systeme verarbeitet Ereignisdaten in einer CDF -Datei mit Inhalten, die in Feldern angeordnet sind, die in einer bestimmten Reihenfolge angezeigt werden. Audience Manager Versuche, CDF Dateien stündlich speichern und in einem sicheren, kundenspezifischen Behälter auf einem Amazon S3 Server. Wir stellen diese Dateien bereit, damit Sie mit Audience Manager Daten außerhalb der durch unsere Benutzeroberfläche festgelegten Grenzen.
Beachten Sie beim Arbeiten mit CDF-Dateien die folgenden Einschränkungen:
Es gibt keinen zu startenden Self-Service-Prozess CDF Dateibereitstellung. Wenden Sie sich an Audience Manager -Berater oder Kundenunterstützung . Während der Implementierung Audience Manager wird
Dateibenachrichtigungen und CDF -Dateien werden in S3 Bucket, wenn sie zum Download bereit sind. Sie sind für die Überwachung und das Herunterladen von Dateien von Ihrem zugewiesenen S3 Verzeichnis. Siehe Verarbeitungsbenachrichtigungen für CDF-Dateien.
Die folgenden Abschnitte und die Häufig gestellte Fragen zu Kundendaten-Feeds kann Ihnen dabei helfen, sich mit diesem Dienst besser vertraut zu machen.
Listet die Datenelemente und Arrays auf und definiert sie in einer CDF -Datei in der Reihenfolge ihres Erscheinungsbilds. Definitionen umfassen Datentypen, diese Informationen sind jedoch nicht Teil eines CDF -Datei.
Ereignispixel sind in CDF-Konfigurationen standardmäßig ausgeschlossen. Stellen Sie sicher, dass Sie in Ihrer Anfrage an die Kundenunterstützung angeben, wenn Sie möchten, dass in Ihren CDF-Dateien Ereignispixel enthalten sind. Jedes Ereignis-Pixel wird in Ihren CDF-Dateien als eindeutige Zeile gefüllt.
A CDF enthält einige oder alle unten definierten Felder. Informationen zur internen Dateiorganisation finden Sie unter Dateistruktur des Kundendaten-Feeds.
Feld | Datentyp | Beschreibung |
---|---|---|
|
Zeitstempel |
Der Zeitpunkt, zu dem eine CDF-Datei von der Datenerfassungsserver (DCS). Der Zeitstempel verwendet die yyyy-mm-dd hh:mm:ss und wird in der UTC-Zeitzone festgelegt.
Hinweis: Die Ereigniszeit ist nicht:
|
|
Zeichenfolge |
Dies ist die Eindeutige Benutzer-ID (UUID), eine 38-stellige Geräte-ID für Ihren Site-Besucher. Weitere Informationen finden Sie unter Index of IDs in Audience Manager. |
|
Numerisch |
Die ID des Containers, der ID-Synchronisierungen auslöst. Dieses Feld wird nur ausgefüllt, wenn Sie die Container-ID im d_nsid in Ihrer Site-Implementierung. Andernfalls wird der Standardwert von 0 nicht in CDF-Dateien enthalten sein. |
|
Numerisches Array |
Ein Array von Eigenschaften-IDs, die alle Eigenschaften enthalten, die ein Besucher im Ereignisaufruf realisiert (für die er qualifiziert ist) hat. Beachten Sie, dass das -Array Eigenschaften enthalten kann, für die sich der Besucher zuvor qualifiziert hatte und für die er sich durch diesen Ereignisaufruf erneut qualifiziert hat. |
|
Numerisches Array |
Ein Array von Segment-IDs, die alle Segmente enthalten, die ein Besucher im Ereignisaufruf realisiert (für die er qualifiziert ist) hat. |
|
Zeichenfolge |
Eine Zeichenfolge, die alle Parameter erfasst (Variablen, IDs, Schlüssel-Wert-Paare, Geräte-Werbe-IDs usw.) beim Ereignisaufruf übergeben wird. Kurzes Beispiel: |
|
Zeichenfolge |
Die nicht kodierte URL der verweisenden Seite (falls vorhanden). |
|
Zeichenfolge |
Die IP-Adresse des Besuchers, der im Ereignisaufruf erfasst wurde. |
|
Zeichenfolge |
Die Experience Cloud Dem Site-Besucher zugewiesene ID (MID). Siehe auch Cookies und der Adobe Experience Platform Identity-Dienst. |
|
Numerisches Array |
Ein Array von Segment-IDs, die zuvor realisierte Segmente und neue Segmente enthalten, für die der Besucher qualifiziert ist. |
|
Numerisches Array |
Ein Array von Erstanbieter- und Drittanbieter-Eigenschafts-IDs, die zuvor realisierte Eigenschaften und neue Eigenschaften enthalten, für die sich der Besucher seit dem letzten generierten Daten-Feed qualifiziert hat. |
Listet die Datenstruktur einer CDF -Datei. Dazu gehören Datensequenz, Feldtrennzeichen und Trennzeichen, eine Datendateizuordnung und eine Beispieldatei.
CDF -Dateien enthalten keine gekennzeichneten Spalten oder Feldkopfzeilen. Stattdessen wird eine CDF -Datei definiert Felder und Arrays ohne Drucken ASCII Zeichen. Außerdem wird die CDF -Datei listet jedes Feld und Array in einer bestimmten Reihenfolge auf. Mithilfe der Kennungen und der Reihenfolge der Felder können Sie die Datei richtig analysieren.
CDF-Dateielement | Beschreibung |
---|---|
Feldtrennzeichen und -trennzeichen |
Diese nicht druckbaren Zeichen definieren die Elemente und die Struktur Ihrer CDF-Datei:
|
Feldsequenz |
Wichtig: Audience Manager behält sich das Recht vor, neue Felder am Ende der CDF-Datei in zukünftigen Versionen hinzuzufügen. Das bedeutet, dass das technische Design Ihres Dateianalysesystems keine feste Anzahl von Spalten annehmen sollte (obwohl es eine feste Reihenfolge für vorhandene Spalten annehmen kann). Daten in Ihrer CDF-Datei werden in der unten gezeigten Reihenfolge angezeigt. /N kann anstelle eines dieser Felder angezeigt werden, was einen Nullwert angibt.
Feldbeschreibungen finden Sie unter Definierte Kundendaten-Feed-Inhalte. |
CDF -Dateidaten werden in der unten gezeigten Reihenfolge angezeigt.
Arrays in einer CDF -Datei beginnen und enden mit der Ctrl + a
Feldtrennzeichen. Dadurch wird das erste Element in einem Array wie ein eigenständiges Datenfeld angezeigt. Beispielsweise wird die traits Array beginnt mit ^A1234
. Array-Trennzeichen und -ID ^B5678
folgt diesem Eintrag. Daher könnten Sie versucht sein, zu glauben, dass das erste Element in der traits Array ist ID 5678 (da es mit ^B
). Dies ist nicht der Fall. Daher müssen Sie mit der Sequenz und Struktur einer Datendatei vertraut sein. Auch wenn das erste Element im realisiert wurde trait Array (oder eines der anderen Arrays in einer CDF -Datei) beginnt mit ^A
, definiert die Reihenfolge des Erscheinungsbilds oder der Position in der Datei den Beginn eines Arrays. Und das erste Element in einem Array wird immer vom vorherigen Eintrag durch ^A
.
Beispiel CDF -Datei in etwa wie folgt aussehen. Wir haben Zeilenumbrüche in dieses Beispiel eingefügt, damit es an die Seite angepasst werden kann.
In den folgenden Abschnitten werden die Elemente in der CDF Dateiname.
Eine typische CDF Der Dateiname enthält die unten aufgeführten Elemente. Hinweis: kursiv gibt einen Variablenplatzhalter an:
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
In S3 -Speicher, werden die Dateien in aufsteigender Reihenfolge nach Partner-ID (PID), Tag und Stunde.
In der folgenden Tabelle sind die Elemente in einer CDF Dateiname.
Dateinamenelement | Beschreibung |
---|---|
|
Dies ist der standardmäßige Stammspeicherbehälter für Ihre CDF-Datei auf einem Amazon S3-Server. |
|
Der Name des schreibgeschützten S3-Buckets, der Ihre CDF-Dateien enthält. |
|
Das Datum, an dem Ihre Datei verarbeitet wurde. |
|
Ein Zeitwert, der in 24-Stunden-Notation ausgedrückt und in der UTC-Zeitzone festgelegt wird. Siehe auch Zeitpunkte der Kundendaten-Feed-Datei und Zeiten des Dateiinhalts .... |
|
Ihre Partner-ID. |
|
Werte, die die Dateisequenz angeben. Die Sequenz erhöht sich wie folgt: 0_0_0 , 0_1_0, 0_2_0 ....1_0_0 |
|
Eine gzip-Dateierweiterung. CDF-Dateien sind gzip-komprimiert. |
Audience Manager schreibt eine .info
Datei S3 -Verzeichnis, über das Sie erfahren können, wann Ihre Customer Data File (CDF) kann heruntergeladen werden. Die .info
auch JSON formatierte Metadaten zum Inhalt Ihrer CDF Dateien. In diesem Abschnitt finden Sie Informationen zur Syntax und zu den Feldern, die von dieser Benachrichtigungsdatei verwendet werden.
Jeder .info
-Datei enthält Files
und Totals
Abschnitt. Die Files
-Abschnitt enthält ein Array, das spezifische Metriken für jede stündliche Datei enthält. Die Totals
enthält Metriken, die über all Ihre CDF -Dateien für einen bestimmten Tag. Der Inhalt Ihrer .info
-Datei ähnlich wie im folgenden Beispiel aussehen.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
In den folgenden Tabellen sind die Elemente aufgelistet und in einer CDF .info
-Datei.
Feld | Beschreibung |
---|---|
|
Startet das Array, das Metadaten zu Ihren CDF-Dateien enthält. |
|
Dateigröße in Byte. |
|
Das Amazon S3 ETag. Die Zahl nach dem Bindestrich zeigt die Anzahl der Teile an, die zum Erstellen der Datei während des mehrteiligen Uploads verwendet wurden. Die |
|
Der Dateiname. Siehe Namenskonventionen für CDF-Dateien. |
|
Eine Indexnummer für jede Datei. |
Feld | Beschreibung |
---|---|
|
Startet das Objekt, das aggregierte Daten zu allen CDF-Dateien enthält. |
|
Der Tag, für den die Daten verfügbar sind. Verwendet yyyy-mm-dd Format. |
|
Die Stunde, für die Daten verfügbar sind. Verwendet das in der UTC-Zeitzone eingestellte 24-Stunden-Format. |
|
Gesamtgröße aller CDF-Dateien für dieses Datum in Byte. |
|
Gesamtzahl der in das S3-Verzeichnis hochgeladenen Dateien. |
Ihre CDF enthält Zeitstempel im Dateinamen und Dateiinhalt. Diese Zeitstempel zeichnen unterschiedliche Ereignisprozesse für dieselben auf CDF -Datei. Es ist nicht ungewöhnlich, verschiedene Zeitstempel im Namen und Inhalt derselben Datei zu sehen. Die Kenntnis jedes Zeitstempels kann Ihnen dabei helfen, häufige Fehler beim Arbeiten mit diesen Daten oder beim Versuch, sie nach Zeit zu sortieren, zu vermeiden.
CDF -Dateien verzeichnen die Zeit an zwei verschiedenen Speicherorten unterschiedlich.
Die folgende Tabelle enthält weitere Details zu Ihrer CDF Datei-Zeitstempel sowie Informationen zu ihrer ordnungsgemäßen Verwendung.
Zeitstempelstandort | Beschreibung |
---|---|
Dateiname | Der Zeitstempel in Ihrer CDF Dateiname gibt die Zeit an, zu der Audience Manager hat begonnen, Ihre Datei für den Versand vorzubereiten. Dieser Zeitstempel wird im UTC Zeitzone. Sie verwendet die hour= , wobei die Zeit als 2-stellige Stunde in 24-Stunden-Notation formatiert ist. Diese Zeit kann sich von der im Dateiinhalt aufgezeichneten Ereigniszeit unterscheiden. Beim Arbeiten mit CDF -Dateien, manchmal werden Sie feststellen, dass Ihre S3 für eine bestimmte Stunde leer ist. Ein leerer Behälter bedeutet, dass er eine der folgenden Bedeutungen haben kann:
Wichtig: Verwenden Sie nicht den Zeitstempel des Dateinamens, um Ereignisse nach Zeit zu gruppieren. Wenn Sie eine Gruppe nach Zeit erstellen müssen, verwenden Sie die EventTime Zeitstempel im Dateiinhalt. |
Dateiinhalt | Der Zeitstempel in Ihrer CDF Der Dateiinhalt gibt die Zeit an, zu der die Data Collection Servers hat die Verarbeitung der Datei gestartet. Dieser Zeitstempel wird im UTC Zeitzone. Sie verwendet die EventTime -Feld, wobei die Uhrzeit als yyyy-mm-dd hh:mm:ss . Diese Zeit entspricht in etwa der tatsächlichen Zeit des Ereignisses auf der Seite, kann sich jedoch von der Stundenanzeige im Dateinamen unterscheiden. Tipp: Im Gegensatz zu hour= Zeitstempel im Dateinamen können Sie EventTime um Daten nach Zeit zu gruppieren. |