Customer Data Feeds customer-data-feeds

Grundlegende Informationen zu Customer Data Feed (CDF)-Dateien und Anweisungen zu den ersten Schritten. Beginnen Sie hier, wenn Sie an CDF-Dateien interessiert sind oder einfach weitere Informationen wünschen.

Dateiinhalte und -zweck file-contents-purpose

Eine CDF-Datei enthält dieselben Daten, die ein Audience Manager-Ereignisaufruf (/event) an unsere Server sendet. Dazu gehören Daten wie Benutzer-IDs, trait IDs, segment IDs und alle anderen Parameter, die von einem Ereignisaufruf erfasst werden. Interne Audience Manager verarbeitet Ereignisdaten in eine CDF Datei, deren Inhalt in Feldern organisiert ist, die in einer festgelegten Reihenfolge erscheinen. Audience Manager versucht, CDF Dateien stündlich zu generieren und speichert sie in einem sicheren, kundenspezifischen Behälter auf einem Amazon S3. Wir stellen Ihnen diese Dateien zur Verfügung, damit Sie mit Audience Manager Daten außerhalb der durch unsere Benutzeroberfläche gesetzten Grenzen arbeiten können.

IMPORTANT
Beachten Sie die folgenden Einschränkungen beim Arbeiten mit CDF-Dateien:
  • Stellen Sie vor der Einrichtung der CDF-Dateibereitstellung sicher, dass Sie über die entsprechenden Berechtigungen von Drittanbieterdatenanbietern für den Export von Drittanbieter-Eigenschaften verfügen. Der Audience Manager unterstützt derzeit keine Funktion in der Benutzeroberfläche, um Exportberechtigungen für die CDF-Dateibereitstellung von Drittanbietern anzufordern. Wenden Sie sich daher bitte unabhängig an diesen Anbieter.
  • Sie sollten CDF-Dateien nicht als Proxy verwenden, um den Seiten-Traffic zu überwachen, Berichtsdiskrepanzen auszugleichen, Abrechnungen zu erstellen usw.

Erste Schritte getting-started

Es gibt keinen Self-Service-Prozess, um CDF Dateibereitstellung zu starten. Wenden Sie sich an Ihren Audience Manager oder die Kundenunterstützung, um zu beginnen. Während der Implementierung hat Ihr Audience Manager folgende Aufgaben:

  • Richten Sie Ihren Amazon S3 Speicher-Bucket ein.
  • Geben Sie für Ihren Dateispeicher-Bucket schreibgeschützte S3-Authentifizierungsdaten an. Sie können keine Verzeichnisse und Dateien sehen oder darauf zugreifen, die zu anderen Kunden gehören.

Dateibenachrichtigungen und CDF werden in Ihrem S3 angezeigt, wenn sie zum Download bereit sind. Sie sind für das Überwachen und Herunterladen von Dateien aus Ihrem zugewiesenen S3-Verzeichnis verantwortlich. Siehe Verarbeitungsbenachrichtigungen für CDF-Dateien.

Nächste Schritte next-steps

Die folgenden Abschnitte und die Häufig gestellte Fragen zu Kundendaten können Ihnen dabei helfen, sich mit diesem Service vertraut zu machen.

Customer Data Feed Inhalte definiert cdf-defined

Listet die Datenelemente und Arrays in einer CDF auf und definiert sie in der Reihenfolge ihres Erscheinungsbildes. Definitionen beinhalten Datentypen, diese Informationen sind jedoch nicht Teil einer CDF.

IMPORTANT
Ereignispixel sind in CDF-Konfigurationen standardmäßig ausgeschlossen. Stellen Sie sicher, dass Sie in Ihrer Anfrage an die Kundenunterstützung angeben, wenn Sie möchten, dass Ereignis-Pixel in Ihre CDF-Dateien aufgenommen werden. Jedes Ereignis-Pixel wird als eindeutige Zeile in Ihren CDF-Dateien aufgefüllt.

Definitionen definitions

Eine CDF-Datei enthält einige oder alle der unten definierten Felder. Informationen zur internen Dateiorganisation finden Sie unter Struktur der Daten-Feed-Datei.

Feld
Datentyp
Beschreibung
Event Time
Zeitstempel

Der Zeitpunkt, zu dem eine CDF-Datei von den Datenerfassungs-Servern (DCS verarbeitet wurde. Der Zeitstempel verwendet das Format JJJJ-MM-TT hhss und wird in der UTC-Zeitzone festgelegt.

Hinweis: Die Ereigniszeit ist nicht:

Device
Zeichenfolge
Dies ist die Unique User ID (UUID), eine 38-stellige Geräte-ID für Ihren Site-Besucher. Siehe auch Index der IDs im Audience Manager.
Container ID
Numerisch
Die ID des Containers, der die ID-Synchronisierung auslöst. Dieses Feld wird nur ausgefüllt, wenn Sie die Container-ID im Feld d_nsid innerhalb Ihrer Site-Implementierung festlegen. Andernfalls wird der Standardwert 0 nicht in die CDF-Dateien aufgenommen.
Realized Traits
Numerisches Array

Ein Array von Eigenschafts-IDs, das alle Eigenschaften enthält, die ein Besucher im Ereignisaufruf realisiert (für sie qualifiziert) hat.

Beachten Sie, dass das Array Eigenschaften enthalten kann, für die sich der Besucher zuvor qualifiziert hatte und für die er sich durch diesen Ereignisaufruf erneut qualifiziert hat.

Realized Segments
Numerisches Array
Ein Array von Segment-IDs, das alle Segmente enthält, die ein Besucher im Ereignisaufruf realisiert (für sie qualifiziert) hat.
Request Parameters
Zeichenfolge

Eine Zeichenfolge, die alle Parameter (Variablen, IDs, Schlüssel-Wert-Paare, Geräte-Werbe-IDs usw.) erfasst, die beim Ereignisaufruf übergeben werden.

Verkürztes Beispiel:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
Zeichenfolge
Die nicht kodierte URL der verweisenden Seite (falls vorhanden).
IP Data Type
Zeichenfolge
Die IP-Adresse für den Besucher, die im Ereignisaufruf erfasst wird.
MCDevice
Zeichenfolge
Die Experience Cloud ID (MID), die dem Site-Besucher zugewiesen wurde. Siehe auch von Cookies und der Adobe Experience Platform Identity Service.
All Segments
Numerisches Array
Ein Array von Segment-IDs, das zuvor realisierte Segmente und neue Segmente enthält, für die der Besucher qualifiziert ist.
All Traits
Numerisches Array
Ein Array von Trait-IDs von Erstanbietern und Drittanbietern, das zuvor realisierte Eigenschaften und neue Eigenschaften enthält, für die sich der Besucher seit dem letzten generierten Daten-Feed qualifiziert hat.

Customer Data Feed Dateistruktur cdf-file-structure

Listet die Datenstruktur einer CDF auf und definiert sie. Dazu gehören die Datensequenz, Feldtrennzeichen und -trennzeichen, eine Datendateizuordnung und eine Beispieldatei.

Datenfeldkennungen und Sequenzen identifiers-and-sequence

CDF Dateien enthalten keine Spalten mit Beschriftungen oder Feldüberschriften. Stattdessen definiert eine CDF Felder und Arrays mit nicht druckbaren ASCII. Außerdem listet die Datei CDF jedes Feld und Array in einer bestimmten Reihenfolge auf. Wenn Sie die Feldkennungen und die Reihenfolge verstehen, können Sie die Datei ordnungsgemäß analysieren.

CDF-Dateielement
Beschreibung
Feldtrennzeichen und Trennzeichen

Diese nicht druckbaren Zeichen definieren die Elemente und die Struktur Ihrer CDF-Datei:

  • Strg + A (ASCII 001 oder ^A) trennt Daten in einzelnen Feldern mit einem nicht druckbaren Leerzeichen.
  • Strg + B (ASCII 002 oder ^B) trennt Daten von einem Array und Anfrageparametern.
  • Strg+C (ASCII 003 oder ^C) definiert Schlüssel-Wert-Paare.
Feldsequenz

Wichtig: Audience Manager behält sich das Recht vor, in zukünftigen Versionen neue Felder am Ende der CDF-Datei hinzuzufügen. Das bedeutet, dass das technische Design Ihres Datei-Parsing-Systems keine feste Anzahl von Spalten annehmen sollte (obwohl es eine feste Reihenfolge für vorhandene Spalten annehmen kann).

Die Daten in Ihrer CDF-Datei werden in der unten gezeigten Reihenfolge angezeigt. /N kann anstelle eines dieser Felder angezeigt werden, was einen Nullwert angibt.

  1. Ereigniszeit
  2. Gerät
  3. Behälter-ID
  4. Realisierte Eigenschaften
  5. Realisierte Segmente
  6. Anfrageparameter
  7. Referer
  8. IP-Adresse
  9. Experience Cloud-Geräte-ID (oder MID). Siehe auch von Cookies und der Adobe Experience Platform Identity Service
  10. Alle Segmente
  11. Alle Eigenschaften

Beschreibungen der Felder finden Sie unter von definierten Inhalten für Kundendaten-Feeds.

CDF Dateizuordnung cdf-file-map

CDF Dateidaten werden in der unten gezeigten Reihenfolge angezeigt.

Arrays identifizieren

Arrays in einer CDF beginnen und enden mit dem Ctrl + a. Dadurch erscheint das erste Element in einem Array wie ein eigenständiges Datenfeld. Beispielsweise beginnt das realisierte traits-Array mit ^A1234. Das Array-Trennzeichen und die ID ^B5678 folgen diesem Eintrag. Daher könnten Sie versucht sein zu glauben, dass das erste Element im realisierten traits die ID 5678 ist (da es mit ^B beginnt). Dies ist nicht der Fall, weshalb Sie mit der Reihenfolge und Struktur einer Datendatei vertraut sein müssen. Obwohl das erste Element im realisierten trait-Array (oder eines der anderen Arrays in einer CDF-Datei) mit ^A beginnt, definiert die Reihenfolge der Darstellung oder Position in der Datei den Beginn eines Arrays. Und das erste Element in einem Array wird immer durch ^A vom vorangehenden Eintrag getrennt.

CDF sample-file

Eine Beispieldatei für CDF könnte in etwa wie folgt aussehen. Wir haben Zeilenumbrüche in dieses Beispiel eingefügt, damit es auf die Seite passt.

Customer Data Feed Dateibenennungskonventionen cdf-naming-conventions

In den folgenden Abschnitten werden die Elemente in Ihrem CDF-Dateinamen aufgelistet und definiert.

CDF Dateiname: Syntax und Beispiel cdf-file-name

Ein typischer CDF-Dateiname enthält die unten aufgeführten Elemente. Hinweis: Kursiv gibt einen Variablenplatzhalter an:

Syntax

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Beispiel

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

In Ihrem S3-Speicher-Bucket werden die Dateien in aufsteigender Reihenfolge nach Partner-ID (PID), Tag und Stunde sortiert.

CDF Dateinamenelemente definiert cdf-file-name-elements

In der folgenden Tabelle werden die -Elemente in einem CDF-Dateinamen aufgelistet und definiert.

Dateinamenelement
Beschreibung
s3://aam-cdf/
Dies ist der standardmäßige Root-Speicher-Bucket für Ihre CDF-Datei auf einem Amazon S3-Server.
your S3 bucket name
Der Name des schreibgeschützten S3-Buckets, der Ihre CDF-Dateien enthält.
day=yyyy-mm-dd
Das Datum, an dem Ihre Datei verarbeitet wurde.
hour=hh
Ein Zeitwert, der in 24-Stunden-Notation ausgedrückt und in der UTC-Zeitzone festgelegt ist. Siehe auch von Kundendaten-Feed-Dateinamen und Dateiinhaltszeiten ….
partner ID
Ihre Partner-ID.
File Sequence_0
Die Dateisequenz identifizierende Werte. Die Sequenz wird wie folgt inkrementiert: 0_0_0 , 0_1_0, 0_2_0….1_0_0
.gz
Eine gzip-Dateierweiterung. CDF-Dateien werden gzip-komprimiert.

Customer Data Feed von Dateiverarbeitungsbenachrichtigungen cdf-file-processing-notifications

Audience Manager schreibt eine .info-Datei in Ihr S3-Verzeichnis, um Sie darüber zu informieren, wann Ihr Customer Data File (CDF) zum Download bereit ist. Die .info enthält auch JSON formatierte Metadaten zum Inhalt Ihrer CDF. In diesem Abschnitt finden Sie Informationen über die Syntax und die von dieser Benachrichtigungsdatei verwendeten Felder.

Beispiel-Informationsdatei sample-info-file

Jede .info enthält einen Files und Totals Abschnitt. Der Abschnitt Files enthält ein -Array, das spezifische Metriken für jede stündliche Datei enthält. Der Abschnitt Totals enthält Metriken, die für alle CDF-Dateien eines bestimmten Tages aggregiert wurden. Der Inhalt Ihrer .info könnte dem folgenden Beispiel ähneln.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Definierte Felder der Informationsdatei info-file-fields-defined

In den folgenden Tabellen werden die Elemente in einer CDF .info-Datei aufgelistet und definiert.

Dateiobjekt

Feld
Beschreibung
Files
Startet das -Array, das Metadaten zu Ihren CDF-Dateien enthält
FileByteSize
Dateigröße in Byte.
FileChecksumMD5
Das Amazon S3 E-Tag. Die Zahl nach dem Bindestrich zeigt die Anzahl der Teile an, die während des mehrteiligen Uploads zur Erstellung der Datei verwendet wurden. Der ETag ist nicht identisch mit der MD5-Prüfsumme der Datei.
FileName
Der Dateiname. Siehe Konventionen für die Benennung von Kundendaten-Feeds.
FileSequenceNumber
Eine Indexnummer für jede Datei.

Gesamtobjekt

Feld
Beschreibung
Totals
Startet das -Objekt, das aggregierte Daten zu allen CDF-Dateien enthält.
Day
Der Tag, für den die Daten verfügbar sind. Verwendet das JJJJ-MM-TT.
Hour
Die Stunde, für die Daten verfügbar sind. Verwendet das in der UTC-Zeitzone festgelegte 24-Stunden-Format.
TotalByteSize
Gesamtgröße aller CDF-Dateien für dieses Datum in Byte.
TotalNumberFiles
Gesamtzahl der in Ihr S3-Verzeichnis hochgeladenen Dateien.

Customer Data Feed Zeiten für Dateinamen und Dateiinhalt sind unterschiedlich different-processing-times

Ihre CDF enthält Zeitstempel im Dateinamen und im Dateiinhalt. Diese Zeitstempel zeichnen verschiedene Ereignisprozesse für dieselbe CDF auf. Es ist nicht ungewöhnlich, dass im Namen und Inhalt derselben Datei unterschiedliche Zeitstempel angezeigt werden. Wenn Sie die einzelnen Zeitstempel verstehen, können Sie häufige Fehler bei der Arbeit mit diesen Daten oder beim Versuch, sie nach Zeit zu sortieren, vermeiden.

Suchen CDF Dateizeitstempeln locating-timestamps

CDF Dateien zeichnen die Zeit an zwei verschiedenen Orten unterschiedlich auf.

Unterschiede zwischen Zeitstempeln understanding-timestamps

Die folgende Tabelle enthält zusätzliche Informationen zu den Zeitstempeln Ihrer CDF-Datei sowie Informationen zu ihrer ordnungsgemäßen Verwendung.

Zeitstempelposition
Beschreibung
Dateiname

Der Zeitstempel in Ihrem CDF-Dateinamen markiert den Zeitpunkt, zu dem Audience Manager mit der Vorbereitung Ihrer Datei für den Versand begonnen haben. Dieser Zeitstempel wird in der UTC Zeitzone festgelegt. Dabei wird der hour=-Parameter verwendet, wobei die Zeit als 2-stellige Stunde in 24-Stunden-Notation formatiert ist. Diese Zeit kann sich von der im Dateiinhalt aufgezeichneten Ereigniszeit unterscheiden. Beim Arbeiten mit CDF Dateien werden Sie manchmal feststellen, dass Ihr S3 für eine bestimmte Stunde leer ist. Ein leerer Bucket bedeutet entweder:

  • Es gibt keine Daten für eine bestimmte Stunde.
  • Unsere Server sind stark ausgelastet und können Dateien für eine bestimmte Stunde nicht verarbeiten. Wenn der Server abholt, werden die Dateien, die in einem früheren Zeitfenster-Bucket-Dateien enthalten sein sollten, in einen Bucket mit einem späteren Zeitwert verschoben. Sie sehen dies beispielsweise, wenn eine Datei, die im Bucket „Stunde 17“ enthalten sein sollte, im Bucket „Stunde 18“ angezeigt wird (mit hour=18 im Dateinamen). In diesem Fall hat der Server wahrscheinlich in Stunde 17 mit der Verarbeitung Ihrer Datei begonnen, konnte sie jedoch nicht innerhalb dieses Zeitintervalls abschließen. Stattdessen wird die Datei an den nächsten stündlichen Zeitbereich gepusht.

Wichtig: Verwenden Sie nicht den Zeitstempel des Dateinamens, um Ereignisse nach Zeit zu gruppieren. Wenn Sie nach Zeit gruppieren müssen, verwenden Sie den EventTime Zeitstempel im Dateiinhalt.

Dateiinhalte
Der Zeitstempel im Inhalt der CDF-Datei markiert den Zeitpunkt, zu dem die Data Collection Servers mit der Verarbeitung der Datei begonnen hat. Dieser Zeitstempel wird in der UTC Zeitzone festgelegt. Es verwendet das Feld EventTime , wobei die Zeit als yyyy-mm-dd hh:mm:ss formatiert ist. Diese Zeit liegt nahe an der tatsächlichen Zeit des Ereignisses auf der Seite, kann sich jedoch von der Stundenanzeige im Dateinamen unterscheiden.
Tipp: Im Gegensatz zum hour= Zeitstempel im Dateinamen können Sie EventTime verwenden, um Daten nach Zeit zu gruppieren.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695