Customer Data Feeds customer-data-feeds

Grundlegende Informationen zu Customer Data Feed (CDF) Dateien und Anweisungen zu den ersten Schritten. Beginnen Sie hier, wenn Sie CDF-Dateien erhalten möchten oder einfach mehr Informationen benötigen.

Dateiinhalt und Zweck file-contents-purpose

Eine CDF -Datei enthält dieselben Daten, die ein Audience Manager -Ereignisaufruf (/event) an unsere Server sendet. Dazu gehören Daten wie Benutzer-IDs, trait IDs, segment IDs und alle anderen Parameter, die von einem Ereignisaufruf erfasst werden. Interne Audience Manager Systeme verarbeiten Ereignisdaten in einer CDF -Datei, deren Inhalt in Felder unterteilt ist, die in einer bestimmten Reihenfolge angezeigt werden. Audience Manager versucht, CDF -Dateien stündlich zu generieren und speichert sie in einem sicheren, kundenspezifischen Behälter auf einem Amazon S3 -Server. Wir stellen diese Dateien bereit, damit Sie mit Audience Manager -Daten außerhalb der durch unsere Benutzeroberfläche festgelegten Grenzen arbeiten können.

IMPORTANT
Beachten Sie beim Arbeiten mit CDF-Dateien die folgenden Einschränkungen:
  • Stellen Sie vor der Einrichtung der CDF-Dateibereitstellung sicher, dass Sie über die entsprechenden Berechtigungen von Drittanbietern für den Export von Eigenschaften von Drittanbietern verfügen. Audience Manager unterstützt derzeit keine Funktionalität in der Benutzeroberfläche, um die Exportberechtigung für CDF-Dateien von Datenanbietern von Drittanbietern anzufordern. Wenden Sie sich daher an diese unabhängig.
  • Sie sollten keine CDF -Dateien als Proxy verwenden, um den Seiten-Traffic zu überwachen, Berichtsdiskrepanzen abzustimmen oder Abrechnungen usw. vorzunehmen.

Erste Schritte getting-started

Es gibt keinen Self-Service-Prozess zum Starten des CDF-Dateiversands. Wenden Sie sich an Ihren Audience Manager -Berater oder die Kundenunterstützung, um zu beginnen. Während der Implementierung wird Ihr Audience Manager -Support-Mitarbeiter:

  • Richten Sie Ihren Amazon S3-Speicher-Bucket ein.
  • Geben Sie Ihrem Dateispeicherbehälter schreibgeschützte S3 Authentifizierungsberechtigungen an. Sie können Verzeichnisse und Dateien, die zu anderen Kunden gehören, nicht sehen oder darauf zugreifen.

Dateibenachrichtigungen und CDF -Dateien werden in Ihrem S3 -Bucket angezeigt, wenn sie zum Download bereit sind. Sie sind für die Überwachung und das Herunterladen von Dateien aus Ihrem zugewiesenen S3 -Verzeichnis verantwortlich. Siehe Verarbeitungsbenachrichtigungen für CDF-Dateien.

Nächste Schritte next-steps

Die folgenden Abschnitte und die FAQ zum Kundendaten-Feed können Ihnen dabei helfen, sich mit diesem Dienst besser vertraut zu machen.

Customer Data Feed Definierte Inhalte cdf-defined

Führt die Datenelemente und Arrays in einer CDF -Datei in der Reihenfolge ihres Erscheinungsbilds auf und definiert sie. Definitionen umfassen Datentypen, diese Informationen sind jedoch nicht Teil einer CDF -Datei.

IMPORTANT
Ereignispixel sind in CDF-Konfigurationen standardmäßig ausgeschlossen. Stellen Sie sicher, dass Sie in Ihrer Anfrage an die Kundenunterstützung angeben, wenn Sie möchten, dass in Ihren CDF-Dateien Ereignispixel enthalten sind. Jedes Ereignis-Pixel wird in Ihren CDF-Dateien als eindeutige Zeile gefüllt.

Definitionen definitions

Eine CDF -Datei enthält einige oder alle unten definierten Felder. Weitere Informationen zur internen Dateiorganisation finden Sie unter Struktur der CDF-Datei für Kunden-Daten-Feeds.

Feld
Datentyp
Beschreibung
Event Time
Zeitstempel

Der Zeitpunkt, zu dem eine CDF-Datei von den Datenerfassungsservern (DCS) verarbeitet wurde. Der Zeitstempel verwendet das Format jjjj-mm-tt hhss und wird in der UTC-Zeitzone festgelegt.

Hinweis: Die Ereigniszeit ist nicht:

Device
Zeichenfolge
Dies ist die Unique User ID (UUID), eine 38-stellige Geräte-ID für Ihren Site-Besucher. Siehe auch Index of IDs in Audience Manager.
Container ID
Numerisch
Die ID des Containers, der ID-Synchronisierungen auslöst. Dieses Feld wird nur ausgefüllt, wenn Sie die Container-ID im Feld d_nsid in Ihrer Site-Implementierung festlegen. Andernfalls wird der Standardwert von 0 nicht in CDF-Dateien enthalten sein.
Realized Traits
Numerisches Array

Ein Array von Eigenschaften-IDs, die alle Eigenschaften enthalten, die ein Besucher im Ereignisaufruf realisiert (für die er qualifiziert ist) hat.

Beachten Sie, dass das -Array Eigenschaften enthalten kann, für die sich der Besucher zuvor qualifiziert hatte und für die er sich durch diesen Ereignisaufruf erneut qualifiziert hat.

Realized Segments
Numerisches Array
Ein Array von Segment-IDs, die alle Segmente enthalten, die ein Besucher im Ereignisaufruf realisiert (für die er qualifiziert ist) hat.
Request Parameters
Zeichenfolge

Eine Zeichenfolge, die alle Parameter erfasst (Variablen, IDs, Schlüssel-Wert-Paare, Geräte-Werbe-IDs usw.) beim Ereignisaufruf übergeben wird.

Kurzes Beispiel:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
Zeichenfolge
Die nicht kodierte URL der verweisenden Seite (falls vorhanden).
IP Data Type
Zeichenfolge
Die IP-Adresse des Besuchers, der im Ereignisaufruf erfasst wurde.
MCDevice
Zeichenfolge
Die dem Site-Besucher zugewiesene Experience Cloud ID (MID). Siehe auch Cookies und der Adobe Experience Platform Identity-Dienst.
All Segments
Numerisches Array
Ein Array von Segment-IDs, die zuvor realisierte Segmente und neue Segmente enthalten, für die der Besucher qualifiziert ist.
All Traits
Numerisches Array
Ein Array von Erstanbieter- und Drittanbieter-Eigenschafts-IDs, die zuvor realisierte Eigenschaften und neue Eigenschaften enthalten, für die sich der Besucher seit dem letzten generierten Daten-Feed qualifiziert hat.

Customer Data Feed Dateistruktur cdf-file-structure

Listet die Datenstruktur einer CDF -Datei auf und definiert sie. Dazu gehören Datensequenz, Feldtrennzeichen und Trennzeichen, eine Datendateizuordnung und eine Beispieldatei.

Datenfeld-IDs und Sequenz identifiers-and-sequence

CDF -Dateien enthalten keine gekennzeichneten Spalten oder Feldkopfzeilen. Stattdessen definiert eine CDF -Datei Felder und Arrays mit nicht druckbaren ASCII -Zeichen. Außerdem werden in der Datei "CDF"jedes Feld und Array in einer bestimmten Reihenfolge aufgelistet. Mithilfe der Kennungen und der Reihenfolge der Felder können Sie die Datei richtig analysieren.

CDF-Dateielement
Beschreibung
Feldtrennzeichen und -trennzeichen

Diese nicht druckbaren Zeichen definieren die Elemente und die Struktur Ihrer CDF-Datei:

  • Strg + A (ASCII 001 oder ^A) trennt Daten in einzelnen Feldern mit einer nicht druckbaren Leerzeichen.
  • Strg + b (ASCII 002 oder ^B) trennt Daten, Array und Anforderungsparameter.
  • Strg + C (ASCII 003 oder ^C) definiert Schlüssel-Wert-Paare.
Feldsequenz

Wichtig: Audience Manager behält sich das Recht vor, neue Felder am Ende der CDF-Datei in zukünftigen Versionen hinzuzufügen. Das bedeutet, dass das technische Design Ihres Dateianalysesystems keine feste Anzahl von Spalten annehmen sollte (obwohl es eine feste Reihenfolge für vorhandene Spalten annehmen kann).

Daten in Ihrer CDF-Datei werden in der unten gezeigten Reihenfolge angezeigt. /N kann anstelle eines dieser Felder angezeigt werden, was einen Nullwert angibt.

  1. Ereigniszeit
  2. Gerät
  3. Behälter-ID
  4. Realisierte Eigenschaften
  5. Realisierte Segmente
  6. Anfrageparameter
  7. Referrer
  8. IP-Adresse
  9. Experience Cloud Device ID (oder MID). Siehe auch Cookies und der Adobe Experience Platform Identity-Dienst
  10. Alle Segmente
  11. Alle Eigenschaften

Feldbeschreibungen finden Sie unter Definierte Kundendaten-Feed-Inhalte.

CDF Dateizuordnung cdf-file-map

CDF -Dateidaten werden in der unten gezeigten Reihenfolge angezeigt.

Identifizieren von Arrays

Arrays in einer CDF -Datei beginnen und enden mit dem Ctrl + a -Feldtrennzeichen. Dadurch wird das erste Element in einem Array wie ein eigenständiges Datenfeld angezeigt. Beispielsweise beginnt das realisierte traits -Array mit ^A1234. Das Array-Trennzeichen und die ID ^B5678 folgen diesem Eintrag. Daher könnten Sie versucht sein, anzunehmen, dass das erste Element im realisierten traits-Array die ID 5678 ist (da es mit ^B beginnt). Dies ist nicht der Fall. Daher müssen Sie mit der Sequenz und Struktur einer Datendatei vertraut sein. Obwohl das erste Element im realisierten trait-Array (oder einem der anderen Arrays in einer CDF-Datei) mit ^A beginnt, definiert die Reihenfolge des Erscheinungsbilds oder der Position in der Datei den Anfang eines Arrays. Und das erste Element in einem Array wird immer durch ^A vom vorherigen Eintrag getrennt.

Beispieldatei CDF sample-file

Eine Beispiel-Datei mit dem Namen CDF könnte in etwa wie folgt aussehen: Wir haben Zeilenumbrüche in dieses Beispiel eingefügt, damit es an die Seite angepasst werden kann.

Customer Data Feed Dateibenennungskonventionen cdf-naming-conventions

In den folgenden Abschnitten werden die Elemente in Ihrem CDF -Dateinamen aufgelistet und definiert.

CDF Dateiname: Syntax und Beispiel cdf-file-name

Ein typischer CDF -Dateiname enthält die unten aufgeführten Elemente. Hinweis: kursiv gibt einen Variablenplatzhalter an:

Syntax

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Beispiel

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

In Ihrem S3 -Speicherbehälter werden die Dateien in aufsteigender Reihenfolge nach Partner-ID (PID), Tag und Stunde sortiert.

CDF Definierte Dateinamenelemente cdf-file-name-elements

In der folgenden Tabelle sind die Elemente in einem CDF -Dateinamen aufgeführt und definiert.

Dateinamenelement
Beschreibung
s3://aam-cdf/
Dies ist der standardmäßige Stammspeicherbehälter für Ihre CDF-Datei auf einem Amazon S3-Server.
your S3 bucket name
Der Name des schreibgeschützten S3-Buckets, der Ihre CDF-Dateien enthält.
day=yyyy-mm-dd
Das Datum, an dem Ihre Datei verarbeitet wurde.
hour=hh
Ein Zeitwert, der in 24-Stunden-Notation ausgedrückt und in der UTC-Zeitzone festgelegt wird. Siehe auch Uhrzeiten von CDF-Dateien und Dateiinhalt ....
partner ID
Ihre Partner-ID.
File Sequence_0
Werte, die die Dateisequenz angeben. Die Sequenz erhöht sich wie folgt: 0_0_0 , 0_1_0, 0_2_0...1_0_0.
.gz
Eine gzip-Dateierweiterung. CDF-Dateien sind gzip-komprimiert.

Customer Data Feed Dateiverarbeitungsbenachrichtigungen cdf-file-processing-notifications

Audience Manager schreibt eine .info -Datei in Ihr S3 -Verzeichnis, um Sie darüber zu informieren, wann Ihr Customer Data File (CDF) zum Download bereit ist. Die Datei .info enthält auch JSON formatierte Metadaten zum Inhalt Ihrer CDF -Dateien. In diesem Abschnitt finden Sie Informationen zur Syntax und zu den Feldern, die von dieser Benachrichtigungsdatei verwendet werden.

Beispiel-Info-Datei sample-info-file

Jede .info -Datei enthält einen Abschnitt Files und Totals. Der Abschnitt Files enthält ein Array, das spezifische Metriken für jede stündliche Datei enthält. Der Abschnitt Totals enthält Metriken, die über all Ihre CDF -Dateien für einen bestimmten Tag hinweg aggregiert werden. Der Inhalt Ihrer .info -Datei könnte in etwa wie im folgenden Beispiel aussehen.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Definierte Informationsdateifelder info-file-fields-defined

In den folgenden Tabellen sind die Elemente in einer Datei vom Typ CDF .info aufgeführt und definiert.

Dateiobjekt

Feld
Beschreibung
Files
Startet das Array, das Metadaten zu Ihren CDF-Dateien enthält.
FileByteSize
Dateigröße in Byte.
FileChecksumMD5
Das Amazon S3 ETag. Die Zahl nach dem Bindestrich zeigt die Anzahl der Teile an, die zum Erstellen der Datei während des mehrteiligen Uploads verwendet wurden. Die ETag ist nicht mit der MD5-Prüfsumme der Datei identisch.
FileName
Der Dateiname. Siehe Namenskonventionen für CDF-Dateien.
FileSequenceNumber
Eine Indexnummer für jede Datei.

Gesamtobjekt

Feld
Beschreibung
Totals
Startet das Objekt, das aggregierte Daten zu allen CDF-Dateien enthält.
Day
Der Tag, für den die Daten verfügbar sind. Verwendet das Format jjj-mm-tt .
Hour
Die Stunde, für die Daten verfügbar sind. Verwendet das in der UTC-Zeitzone eingestellte 24-Stunden-Format.
TotalByteSize
Gesamtgröße aller CDF-Dateien für dieses Datum in Byte.
TotalNumberFiles
Gesamtzahl der in das S3-Verzeichnis hochgeladenen Dateien.

Customer Data Feed Dateinamenzeiten und Dateiinhaltszeiten sind unterschiedlich different-processing-times

Ihre CDF-Datei enthält Zeitstempel im Dateinamen und Dateiinhalt. Diese Zeitstempel zeichnen verschiedene Ereignisprozesse für dieselbe CDF -Datei auf. Es ist nicht ungewöhnlich, verschiedene Zeitstempel im Namen und Inhalt derselben Datei zu sehen. Die Kenntnis jedes Zeitstempels kann Ihnen dabei helfen, häufige Fehler beim Arbeiten mit diesen Daten oder beim Versuch, sie nach Zeit zu sortieren, zu vermeiden.

Suchen von CDF Datei-Zeitstempeln locating-timestamps

CDF -Dateien zeichnen die Zeit an zwei verschiedenen Speicherorten unterschiedlich auf.

Unterschiede zwischen Zeitstempeln verstehen understanding-timestamps

Die folgende Tabelle enthält weitere Details zu Ihren CDF-Datei-Zeitstempeln sowie Informationen zu ihrer ordnungsgemäßen Verwendung.

Zeitstempelstandort
Beschreibung
Dateiname

Der Zeitstempel in Ihrem CDF -Dateinamen bezeichnet den Zeitpunkt, zu dem Audience Manager mit der Vorbereitung der Datei für die Bereitstellung begonnen hat. Dieser Zeitstempel wird in der Zeitzone UTC festgelegt. Es wird der Parameter hour= verwendet, wobei die Zeit in 24-Stunden-Notation als 2-stellige Stunde formatiert ist. Diese Zeit kann sich von der im Dateiinhalt aufgezeichneten Ereigniszeit unterscheiden. Beim Arbeiten mit CDF -Dateien werden Sie manchmal feststellen, dass Ihr S3 -Bucket für eine bestimmte Stunde leer ist. Ein leerer Behälter bedeutet, dass er eine der folgenden Bedeutungen haben kann:

  • Für diese bestimmte Stunde liegen keine Daten vor.
  • Unsere Server sind stark ausgelastet und können Dateien für eine bestimmte Stunde nicht verarbeiten. Wenn der Server den Upload aufnimmt, werden die Dateien, die in frühere Zeitbehälter-Dateien hätte aufgenommen werden sollen, in einen Bucket mit einem späteren Zeitwert eingefügt. Dies wird beispielsweise angezeigt, wenn eine Datei, die in der Gruppe "Stunde 17"enthalten sein sollte, in der Gruppe "Stunde 18"angezeigt wird (mit "hour=18"im Dateinamen). In diesem Fall hat der Server wahrscheinlich mit der Verarbeitung Ihrer Datei in Stunde 17 begonnen, konnte sie jedoch nicht innerhalb dieses Zeitintervalls abschließen. Stattdessen wird die Datei an den nächsten stündlichen Zeitbehälter gesendet.

Wichtig: Verwenden Sie nicht den Zeitstempel des Dateinamens, um Ereignisse nach Zeit zu gruppieren. Verwenden Sie den Zeitstempel EventTime im Dateiinhalt, wenn Sie eine Zeitgruppe nach Zeit erstellen müssen.

Dateiinhalt
Der Zeitstempel in Ihrem CDF -Dateiinhalt kennzeichnet den Zeitpunkt, zu dem Data Collection Servers mit der Verarbeitung der Datei begonnen hat. Dieser Zeitstempel wird in der Zeitzone UTC festgelegt. Es wird das Feld EventTime verwendet, wobei die Zeit als yyyy-mm-dd hh:mm:ss formatiert ist. Diese Zeit entspricht in etwa der tatsächlichen Zeit des Ereignisses auf der Seite, kann sich jedoch von der Stundenanzeige im Dateinamen unterscheiden.
Tipp: Im Gegensatz zum hour= Zeitstempel im Dateinamen können Sie mit EventTime Daten nach Zeit gruppieren.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695