Customer Data Feeds customer-data-feeds
Grundlegende Informationen zu Customer Data Feed (CDF)-Dateien und Anweisungen zu den ersten Schritten. Beginnen Sie hier, wenn Sie an CDF-Dateien interessiert sind oder einfach weitere Informationen wünschen.
Dateiinhalte und -zweck file-contents-purpose
Eine CDF-Datei enthält dieselben Daten, die ein Audience Manager-Ereignisaufruf (/event
) an unsere Server sendet. Dazu gehören Daten wie Benutzer-IDs, trait IDs, segment IDs und alle anderen Parameter, die von einem Ereignisaufruf erfasst werden. Interne Audience Manager verarbeitet Ereignisdaten in eine CDF Datei, deren Inhalt in Feldern organisiert ist, die in einer festgelegten Reihenfolge erscheinen. Audience Manager versucht, CDF Dateien stündlich zu generieren und speichert sie in einem sicheren, kundenspezifischen Behälter auf einem Amazon S3. Wir stellen Ihnen diese Dateien zur Verfügung, damit Sie mit Audience Manager Daten außerhalb der durch unsere Benutzeroberfläche gesetzten Grenzen arbeiten können.
- Stellen Sie vor der Einrichtung der CDF-Dateibereitstellung sicher, dass Sie über die entsprechenden Berechtigungen von Drittanbieterdatenanbietern für den Export von Drittanbieter-Eigenschaften verfügen. Der Audience Manager unterstützt derzeit keine Funktion in der Benutzeroberfläche, um Exportberechtigungen für die CDF-Dateibereitstellung von Drittanbietern anzufordern. Wenden Sie sich daher bitte unabhängig an diesen Anbieter.
- Sie sollten CDF-Dateien nicht als Proxy verwenden, um den Seiten-Traffic zu überwachen, Berichtsdiskrepanzen auszugleichen, Abrechnungen zu erstellen usw.
Erste Schritte getting-started
Es gibt keinen Self-Service-Prozess, um CDF Dateibereitstellung zu starten. Wenden Sie sich an Ihren Audience Manager oder die Kundenunterstützung, um zu beginnen. Während der Implementierung hat Ihr Audience Manager folgende Aufgaben:
- Richten Sie Ihren Amazon S3 Speicher-Bucket ein.
- Geben Sie für Ihren Dateispeicher-Bucket schreibgeschützte S3-Authentifizierungsdaten an. Sie können keine Verzeichnisse und Dateien sehen oder darauf zugreifen, die zu anderen Kunden gehören.
Dateibenachrichtigungen und CDF werden in Ihrem S3 angezeigt, wenn sie zum Download bereit sind. Sie sind für das Überwachen und Herunterladen von Dateien aus Ihrem zugewiesenen S3-Verzeichnis verantwortlich. Siehe Verarbeitungsbenachrichtigungen für CDF-Dateien.
Nächste Schritte next-steps
Die folgenden Abschnitte und die Häufig gestellte Fragen zu Kundendaten können Ihnen dabei helfen, sich mit diesem Service vertraut zu machen.
Customer Data Feed Inhalte definiert cdf-defined
Listet die Datenelemente und Arrays in einer CDF auf und definiert sie in der Reihenfolge ihres Erscheinungsbildes. Definitionen beinhalten Datentypen, diese Informationen sind jedoch nicht Teil einer CDF.
Definitionen definitions
Eine CDF-Datei enthält einige oder alle der unten definierten Felder. Informationen zur internen Dateiorganisation finden Sie unter Struktur der Daten-Feed-Datei.
Event Time
Der Zeitpunkt, zu dem eine CDF-Datei von den Datenerfassungs-Servern (DCS verarbeitet wurde. Der Zeitstempel verwendet das Format JJJJ-MM-TT hhss und wird in der UTC-Zeitzone festgelegt.
Hinweis: Die Ereigniszeit ist nicht:
- Die Zeit des Seitenereignisses oder des Ereignisaufrufs selbst, obwohl sie nahe an diesen Zeiten liegen kann.
- Bezieht sich auf die DCS-Stunde im Dateinamen. Siehe auch von Kundendaten-Feed-Dateinamen und Dateiinhaltszeiten ….
Device
Container ID
Realized Traits
Ein Array von Eigenschafts-IDs, das alle Eigenschaften enthält, die ein Besucher im Ereignisaufruf realisiert (für sie qualifiziert) hat.
Beachten Sie, dass das Array Eigenschaften enthalten kann, für die sich der Besucher zuvor qualifiziert hatte und für die er sich durch diesen Ereignisaufruf erneut qualifiziert hat.
Realized Segments
Request Parameters
Eine Zeichenfolge, die alle Parameter (Variablen, IDs, Schlüssel-Wert-Paare, Geräte-Werbe-IDs usw.) erfasst, die beim Ereignisaufruf übergeben werden.
Verkürztes Beispiel:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Customer Data Feed Dateistruktur cdf-file-structure
Listet die Datenstruktur einer CDF auf und definiert sie. Dazu gehören die Datensequenz, Feldtrennzeichen und -trennzeichen, eine Datendateizuordnung und eine Beispieldatei.
Datenfeldkennungen und Sequenzen identifiers-and-sequence
CDF Dateien enthalten keine Spalten mit Beschriftungen oder Feldüberschriften. Stattdessen definiert eine CDF Felder und Arrays mit nicht druckbaren ASCII. Außerdem listet die Datei CDF jedes Feld und Array in einer bestimmten Reihenfolge auf. Wenn Sie die Feldkennungen und die Reihenfolge verstehen, können Sie die Datei ordnungsgemäß analysieren.
Diese nicht druckbaren Zeichen definieren die Elemente und die Struktur Ihrer CDF-Datei:
- Strg + A (ASCII
001
oder^A
) trennt Daten in einzelnen Feldern mit einem nicht druckbaren Leerzeichen. - Strg + B (ASCII
002
oder^B
) trennt Daten von einem Array und Anfrageparametern. - Strg+C (ASCII
003
oder^C
) definiert Schlüssel-Wert-Paare.
Wichtig: Audience Manager behält sich das Recht vor, in zukünftigen Versionen neue Felder am Ende der CDF-Datei hinzuzufügen. Das bedeutet, dass das technische Design Ihres Datei-Parsing-Systems keine feste Anzahl von Spalten annehmen sollte (obwohl es eine feste Reihenfolge für vorhandene Spalten annehmen kann).
Die Daten in Ihrer CDF-Datei werden in der unten gezeigten Reihenfolge angezeigt. /N kann anstelle eines dieser Felder angezeigt werden, was einen Nullwert angibt.
- Ereigniszeit
- Gerät
- Behälter-ID
- Realisierte Eigenschaften
- Realisierte Segmente
- Anfrageparameter
- Referer
- IP-Adresse
- Experience Cloud-Geräte-ID (oder MID). Siehe auch von Cookies und der Adobe Experience Platform Identity Service
- Alle Segmente
- Alle Eigenschaften
Beschreibungen der Felder finden Sie unter von definierten Inhalten für Kundendaten-Feeds.
CDF Dateizuordnung cdf-file-map
CDF Dateidaten werden in der unten gezeigten Reihenfolge angezeigt.
Arrays identifizieren
Arrays in einer CDF beginnen und enden mit dem Ctrl + a
. Dadurch erscheint das erste Element in einem Array wie ein eigenständiges Datenfeld. Beispielsweise beginnt das realisierte traits-Array mit ^A1234
. Das Array-Trennzeichen und die ID ^B5678
folgen diesem Eintrag. Daher könnten Sie versucht sein zu glauben, dass das erste Element im realisierten traits die ID 5678 ist (da es mit ^B
beginnt). Dies ist nicht der Fall, weshalb Sie mit der Reihenfolge und Struktur einer Datendatei vertraut sein müssen. Obwohl das erste Element im realisierten trait-Array (oder eines der anderen Arrays in einer CDF-Datei) mit ^A
beginnt, definiert die Reihenfolge der Darstellung oder Position in der Datei den Beginn eines Arrays. Und das erste Element in einem Array wird immer durch ^A
vom vorangehenden Eintrag getrennt.
CDF sample-file
Eine Beispieldatei für CDF könnte in etwa wie folgt aussehen. Wir haben Zeilenumbrüche in dieses Beispiel eingefügt, damit es auf die Seite passt.
Customer Data Feed Dateibenennungskonventionen cdf-naming-conventions
In den folgenden Abschnitten werden die Elemente in Ihrem CDF-Dateinamen aufgelistet und definiert.
CDF Dateiname: Syntax und Beispiel cdf-file-name
Ein typischer CDF-Dateiname enthält die unten aufgeführten Elemente. Hinweis: Kursiv gibt einen Variablenplatzhalter an:
Syntax
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
Beispiel
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
In Ihrem S3-Speicher-Bucket werden die Dateien in aufsteigender Reihenfolge nach Partner-ID (PID), Tag und Stunde sortiert.
CDF Dateinamenelemente definiert cdf-file-name-elements
In der folgenden Tabelle werden die -Elemente in einem CDF-Dateinamen aufgelistet und definiert.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed von Dateiverarbeitungsbenachrichtigungen cdf-file-processing-notifications
Audience Manager schreibt eine .info
-Datei in Ihr S3-Verzeichnis, um Sie darüber zu informieren, wann Ihr Customer Data File (CDF) zum Download bereit ist. Die .info
enthält auch JSON formatierte Metadaten zum Inhalt Ihrer CDF. In diesem Abschnitt finden Sie Informationen über die Syntax und die von dieser Benachrichtigungsdatei verwendeten Felder.
Beispiel-Informationsdatei sample-info-file
Jede .info
enthält einen Files
und Totals
Abschnitt. Der Abschnitt Files
enthält ein -Array, das spezifische Metriken für jede stündliche Datei enthält. Der Abschnitt Totals
enthält Metriken, die für alle CDF-Dateien eines bestimmten Tages aggregiert wurden. Der Inhalt Ihrer .info
könnte dem folgenden Beispiel ähneln.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Definierte Felder der Informationsdatei info-file-fields-defined
In den folgenden Tabellen werden die Elemente in einer CDF .info
-Datei aufgelistet und definiert.
Dateiobjekt
Files
FileByteSize
FileChecksumMD5
ETag
ist nicht identisch mit der MD5-Prüfsumme der Datei.FileName
FileSequenceNumber
Gesamtobjekt
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed Zeiten für Dateinamen und Dateiinhalt sind unterschiedlich different-processing-times
Ihre CDF enthält Zeitstempel im Dateinamen und im Dateiinhalt. Diese Zeitstempel zeichnen verschiedene Ereignisprozesse für dieselbe CDF auf. Es ist nicht ungewöhnlich, dass im Namen und Inhalt derselben Datei unterschiedliche Zeitstempel angezeigt werden. Wenn Sie die einzelnen Zeitstempel verstehen, können Sie häufige Fehler bei der Arbeit mit diesen Daten oder beim Versuch, sie nach Zeit zu sortieren, vermeiden.
Suchen CDF Dateizeitstempeln locating-timestamps
CDF Dateien zeichnen die Zeit an zwei verschiedenen Orten unterschiedlich auf.
Unterschiede zwischen Zeitstempeln understanding-timestamps
Die folgende Tabelle enthält zusätzliche Informationen zu den Zeitstempeln Ihrer CDF-Datei sowie Informationen zu ihrer ordnungsgemäßen Verwendung.
Der Zeitstempel in Ihrem CDF-Dateinamen markiert den Zeitpunkt, zu dem Audience Manager mit der Vorbereitung Ihrer Datei für den Versand begonnen haben. Dieser Zeitstempel wird in der UTC Zeitzone festgelegt. Dabei wird der hour=
-Parameter verwendet, wobei die Zeit als 2-stellige Stunde in 24-Stunden-Notation formatiert ist. Diese Zeit kann sich von der im Dateiinhalt aufgezeichneten Ereigniszeit unterscheiden. Beim Arbeiten mit CDF Dateien werden Sie manchmal feststellen, dass Ihr S3 für eine bestimmte Stunde leer ist. Ein leerer Bucket bedeutet entweder:
- Es gibt keine Daten für eine bestimmte Stunde.
- Unsere Server sind stark ausgelastet und können Dateien für eine bestimmte Stunde nicht verarbeiten. Wenn der Server abholt, werden die Dateien, die in einem früheren Zeitfenster-Bucket-Dateien enthalten sein sollten, in einen Bucket mit einem späteren Zeitwert verschoben. Sie sehen dies beispielsweise, wenn eine Datei, die im Bucket „Stunde 17“ enthalten sein sollte, im Bucket „Stunde 18“ angezeigt wird (mit
hour=18
im Dateinamen). In diesem Fall hat der Server wahrscheinlich in Stunde 17 mit der Verarbeitung Ihrer Datei begonnen, konnte sie jedoch nicht innerhalb dieses Zeitintervalls abschließen. Stattdessen wird die Datei an den nächsten stündlichen Zeitbereich gepusht.
Wichtig: Verwenden Sie nicht den Zeitstempel des Dateinamens, um Ereignisse nach Zeit zu gruppieren. Wenn Sie nach Zeit gruppieren müssen, verwenden Sie den EventTime
Zeitstempel im Dateiinhalt.
EventTime
, wobei die Zeit als yyyy-mm-dd hh:mm:ss
formatiert ist. Diese Zeit liegt nahe an der tatsächlichen Zeit des Ereignisses auf der Seite, kann sich jedoch von der Stundenanzeige im Dateinamen unterscheiden.Tipp: Im Gegensatz zum
hour=
Zeitstempel im Dateinamen können Sie EventTime
verwenden, um Daten nach Zeit zu gruppieren.