Customer Data Feeds

Grundlegende Informationen zu Customer Data Feed (CDF)-Dateien und Anweisungen zu den ersten Schritten. Beginnen Sie hier, wenn Sie CDF Dateien empfangen möchten oder einfach mehr Informationen benötigen.

Dateiinhalt und Zweck

Eine CDF-Datei enthält dieselben Daten, die ein Audience Manager-Ereignisaufruf (/event) an unsere Server sendet. Dazu gehören Daten wie Benutzer-IDs, trait IDs, segment IDs und alle anderen Parameter, die von einem Ereignisaufruf erfasst werden. Interne Systeme Audience Manager verarbeiten Ereignisdaten in einer CDF-Datei, deren Inhalt in Felder unterteilt ist, die in einer bestimmten Reihenfolge angezeigt werden. Audience Manager versucht, CDF Dateien stündlich zu generieren und speichert sie in einem sicheren, kundenspezifischen Behälter auf einem Amazon S3 Server. Wir stellen diese Dateien bereit, damit Sie mit Audience Manager Daten außerhalb der durch unsere Benutzeroberfläche festgelegten Grenzen arbeiten können.

WICHTIG

Beachten Sie beim Arbeiten mit CDF-Dateien die folgenden Einschränkungen:

  • Stellen Sie vor der Einrichtung der CDF-Dateibereitstellung sicher, dass Sie über die entsprechenden Berechtigungen von Drittanbietern für den Export von Eigenschaften von Drittanbietern verfügen. Audience Manager unterstützt derzeit keine Funktionalität in der Benutzeroberfläche, um die Exportberechtigung für CDF-Dateien von Datenanbietern von Drittanbietern anzufordern. Wenden Sie sich daher an diese unabhängig.
  • Sie sollten keine CDF-Dateien als Proxy verwenden, um den Seiten-Traffic zu überwachen, Berichtsdiskrepanzen abzustimmen oder Abrechnungen usw. vorzunehmen.

Erste Schritte

Es gibt keinen Self-Service-Prozess zum Starten der CDF Dateibereitstellung. Wenden Sie sich an Ihren Audience Manager-Berater oder an die Kundenunterstützung, um zu beginnen. Während der Implementierung wird Ihr Audience Manager-Support-Mitarbeiter:

  • Richten Sie den Speicher-Bucket Amazon S3 ein.
  • Geben Sie Ihrem Dateispeicherbehälter schreibgeschützte S3 Authentifizierungsberechtigungen an. Sie können Verzeichnisse und Dateien, die zu anderen Kunden gehören, nicht sehen oder darauf zugreifen.

Dateibenachrichtigungen und CDF -Dateien werden in Ihrem S3 -Bucket angezeigt, wenn sie zum Download bereit sind. Sie sind für die Überwachung und das Herunterladen von Dateien aus Ihrem zugewiesenen S3-Verzeichnis verantwortlich. Siehe Verarbeitungsbenachrichtigungen für CDF-Dateien.

Nächste Schritte

Die folgenden Abschnitte und die FAQ zu Kundendaten-Feeds können Ihnen dabei helfen, sich mit diesem Dienst besser vertraut zu machen.

Customer Data Feed Definierte Inhalte

Führt die Datenelemente und Arrays in einer CDF-Datei in der Reihenfolge ihres Erscheinungsbilds auf und definiert sie. Definitionen umfassen Datentypen, diese Informationen sind jedoch nicht Teil einer CDF-Datei.

Definitionen

Eine CDF-Datei enthält einige oder alle unten definierten Felder. Informationen zur internen Dateiorganisation finden Sie unter Struktur der CDF-Datei.

Feld Datentyp Beschreibung

Event Time

Zeitstempel

Der Zeitpunkt, zu dem eine CDF-Datei von den Datenerfassungsservern (DCS) verarbeitet wurde. Der Zeitstempel verwendet das Format yyyy-mm-dd hh:mm:ss und wird in der UTC-Zeitzone festgelegt.

Hinweis: Die Ereigniszeit ist nicht:

Device

Zeichenfolge

Dies ist die Unique User-ID (UUID), die eine 38-stellige Geräte-ID für Ihren Site-Besucher darstellt. Weitere Informationen finden Sie unter Index of IDs in Audience Manager.

Container ID

Numerisch

Die ID des Containers, der ID-Synchronisierungen auslöst.

Realized Traits

Numerisches Array

Ein Array von Eigenschaften-IDs, die alle Eigenschaften enthalten, die ein Besucher im Ereignisaufruf realisiert (für die er qualifiziert ist) hat.

Beachten Sie, dass das -Array Eigenschaften enthalten kann, für die sich der Besucher zuvor qualifiziert hatte und für die er sich durch diesen Ereignisaufruf erneut qualifiziert hat.

Realized Segments

Numerisches Array

Ein Array von Segment-IDs, die alle Segmente enthalten, die ein Besucher im Ereignisaufruf realisiert (für die er qualifiziert ist) hat.

Request Parameters

Zeichenfolge

Eine Zeichenfolge, die alle Parameter erfasst (Variablen, IDs, Schlüssel-Wert-Paare, Geräte-Werbe-IDs usw.) beim Ereignisaufruf übergeben wird.

Kurzes Beispiel:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type

Zeichenfolge

Die nicht kodierte URL der verweisenden Seite (falls vorhanden).

IP Data Type

Zeichenfolge

Die IP-Adresse des Besuchers, der im Ereignisaufruf erfasst wurde.

MCDevice

Zeichenfolge

Die dem Site-Besucher zugewiesene -Experience Cloud-ID (MID). Siehe auch Cookies und der Adobe Experience Platform Identity Service.

All Segments

Numerisches Array

Ein Array von Segment-IDs, die zuvor realisierte Segmente und neue Segmente enthalten, für die der Besucher qualifiziert ist.

All Traits

Numerisches Array

Ein Array von Erstanbieter- und Drittanbieter-Eigenschafts-IDs, die zuvor realisierte Eigenschaften und neue Eigenschaften enthalten, für die sich der Besucher seit dem letzten generierten Daten-Feed qualifiziert hat.

Customer Data Feed Dateistruktur

Listet die Datenstruktur einer CDF-Datei auf und definiert sie. Dazu gehören Datensequenz, Feldtrennzeichen und Trennzeichen, eine Datendateizuordnung und eine Beispieldatei.

Datenfeld-IDs und -Sequenzen

CDF -Dateien enthalten keine gekennzeichneten Spalten oder Feldkopfzeilen. Stattdessen definiert eine CDF-Datei Felder und Arrays mit nicht druckbaren ASCII-Zeichen. Außerdem werden in der Datei CDF jedes Feld und Array in einer bestimmten Reihenfolge aufgelistet. Mithilfe der Kennungen und der Reihenfolge der Felder können Sie die Datei richtig analysieren.

CDF-Dateielement Beschreibung

Feldtrennzeichen und -trennzeichen

Diese nicht druckbaren Zeichen definieren die Elemente und die Struktur Ihrer CDF-Datei:

  • Strg + A (ASCII 001 oder ^A) trennt Daten in einzelnen Feldern mit einer nicht druckbaren Leerzeichen.
  • Strg + b (ASCII 002 oder ^B) trennt Daten, ein Array und Anforderungsparameter.
  • Strg + C (ASCII 003 oder ^C) definiert Schlüssel-Wert-Paare.

Feldsequenz

Wichtig: Audience Manager behält sich das Recht vor, neue Felder am Ende der CDF-Datei in zukünftigen Versionen hinzuzufügen. Das bedeutet, dass das technische Design Ihres Dateianalysesystems keine feste Anzahl von Spalten annehmen sollte (obwohl es eine feste Reihenfolge für vorhandene Spalten annehmen kann).

Daten in Ihrer CDF-Datei werden in der unten gezeigten Reihenfolge angezeigt.

  1. Ereigniszeit
  2. Gerät
  3. Behälter-ID
  4. Realisierte Eigenschaften
  5. Realisierte Segmente
  6. Anfrageparameter
  7. Referer
  8. IP-Adresse
  9. Experience Cloud Device ID (oder MID). Siehe auch Cookies und der Adobe Experience Platform Identity-Dienst
  10. Alle Segmente
  11. Alle Eigenschaften

Feldbeschreibungen finden Sie unter Definierte Kundendaten-Feed-Inhalte.

CDF Dateizuordnung

CDF -Dateidaten werden in der unten gezeigten Reihenfolge angezeigt.

Identifizieren von Arrays

Arrays in einer CDF-Datei beginnen und enden mit dem Ctrl + a-Feldtrennzeichen. Dadurch wird das erste Element in einem Array wie ein eigenständiges Datenfeld angezeigt. Beispielsweise beginnt das realisierte traits-Array mit ^A1234. Das Array-Trennzeichen und die ID ^B5678 folgen diesem Eintrag. Daher könnten Sie versucht sein zu glauben, dass das erste Element im realisierten traits-Array die ID 5678 ist (da es mit ^B beginnt). Dies ist nicht der Fall. Daher müssen Sie mit der Sequenz und Struktur einer Datendatei vertraut sein. Obwohl das erste Element im realisierten trait-Array (oder einem der anderen Arrays in einer CDF-Datei) mit ^A beginnt, definiert die Reihenfolge des Erscheinungsbilds oder der Position in der Datei den Anfang eines Arrays. Und das erste Element in einem Array wird immer vom vorherigen Eintrag durch ^A getrennt.

Beispieldatei CDF

Eine CDF-Beispieldatei könnte in etwa wie folgt aussehen: Wir haben Zeilenumbrüche in dieses Beispiel eingefügt, damit es an die Seite angepasst werden kann.

Customer Data Feed Namenskonventionen für Dateien

In den folgenden Abschnitten werden die Elemente in Ihrem CDF-Dateinamen aufgelistet und definiert.

CDF Dateiname: Syntax und Beispiel

Ein typischer CDF-Dateiname enthält die unten aufgeführten Elemente. Hinweis: kursiv gibt einen Variablenplatzhalter an:

Syntax

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Beispiel

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

Im Speicher-Bucket S3 werden Dateien in aufsteigender Reihenfolge nach Partner-ID (PID), Tag und Stunde sortiert.

CDF Definierte Dateinamenelemente

In der folgenden Tabelle sind die Elemente in einem CDF-Dateinamen aufgeführt und definiert.

Dateinamenelement Beschreibung

s3://aam-cdf/

Dies ist der standardmäßige Stammspeicherbehälter für Ihre CDF-Datei auf einem Amazon S3-Server.

your S3 bucket name

Der Name des schreibgeschützten S3-Buckets, der Ihre CDF-Dateien enthält.

day=yyyy-mm-dd

Das Datum, an dem Ihre Datei verarbeitet wurde.

hour=hh

Ein Zeitwert, der in 24-Stunden-Notation ausgedrückt und in der UTC-Zeitzone festgelegt wird. Siehe auch Zeitpunkte für CDF-Dateien und Zeiten für Dateiinhalte ....

partner ID

Ihre Partner-ID.

AAM process ID_0

Eine interne Prozess-ID, Audience Manager.

.gz

Eine gzip-Dateierweiterung. CDF-Dateien sind gzip-komprimiert.

Customer Data Feed Dateiverarbeitungsbenachrichtigungen

Audience Manager schreibt eine .info Datei in Ihr S3 Verzeichnis, um Sie darüber zu informieren, wann Ihr ( Customer Data File CDF) zum Download bereit ist. Die .info-Datei enthält auch JSON formatierte Metadaten zum Inhalt Ihrer CDF-Dateien. In diesem Abschnitt finden Sie Informationen zur Syntax und zu den Feldern, die von dieser Benachrichtigungsdatei verwendet werden.

Beispiel-Info-Datei

Jede .info-Datei enthält einen Abschnitt Files und Totals . Der Abschnitt Files enthält ein Array, das spezifische Metriken für jede stündliche Datei enthält. Der Abschnitt Totals enthält Metriken, die über all Ihre CDF-Dateien für einen bestimmten Tag hinweg aggregiert werden. Der Inhalt Ihrer .info-Datei könnte in etwa wie im folgenden Beispiel aussehen.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Definierte Informationsdateifelder

In den folgenden Tabellen sind die Elemente in einer CDF .info-Datei aufgeführt und definiert.

Dateiobjekt

Feld Beschreibung

Files

Startet das Array, das Metadaten zu Ihren CDF-Dateien enthält.

FileByteSize

Dateigröße in Byte.

FileChecksumMD5

Das Amazon S3 ETag. Die Zahl nach dem Bindestrich zeigt die Anzahl der Teile an, die zum Erstellen der Datei während des mehrteiligen Uploads verwendet wurden. ETag ist nicht mit der MD5-Prüfsumme der Datei identisch.

FileName

Der Dateiname. Siehe Namenskonventionen für CDF-Dateien.

FileSequenceNumber

Eine Indexnummer für jede Datei.

Gesamtobjekt

Feld Beschreibung

Totals

Startet das Objekt, das aggregierte Daten zu allen CDF-Dateien enthält.

Day

Der Tag, für den die Daten verfügbar sind. Verwendet das Format yyyy-mm-dd .

Hour

Die Stunde, für die Daten verfügbar sind. Verwendet das in der UTC-Zeitzone eingestellte 24-Stunden-Format.

TotalByteSize

Gesamtgröße aller CDF-Dateien für dieses Datum in Byte.

TotalNumberFiles

Gesamtzahl der in das S3-Verzeichnis hochgeladenen Dateien.

Customer Data Feed Dateinamenzeiten und Dateiinhaltszeiten sind unterschiedlich

Ihre CDF-Datei enthält Zeitstempel im Dateinamen und Dateiinhalt. Diese Zeitstempel zeichnen verschiedene Ereignisprozesse für dieselbe CDF-Datei auf. Es ist nicht ungewöhnlich, verschiedene Zeitstempel im Namen und Inhalt derselben Datei zu sehen. Die Kenntnis jedes Zeitstempels kann Ihnen dabei helfen, häufige Fehler beim Arbeiten mit diesen Daten oder beim Versuch, sie nach Zeit zu sortieren, zu vermeiden.

Suchen nach CDF Datei-Zeitstempeln

CDF -Dateien verzeichnen die Zeit an zwei verschiedenen Speicherorten unterschiedlich.

Unterschiede zwischen Zeitstempeln verstehen

Die folgende Tabelle enthält weitere Details zu Ihren CDF Datei-Zeitstempeln sowie Informationen zur ordnungsgemäßen Verwendung dieser Zeitstempel.

Zeitstempelstandort Beschreibung
Dateiname Der Zeitstempel im Dateinamen CDF gibt den Zeitpunkt an, zu dem Audience Manager mit der Vorbereitung der Datei für die Bereitstellung begonnen hat. Dieser Zeitstempel wird in der Zeitzone UTC festgelegt. Es wird der Parameter hour= verwendet, wobei die Zeit als 2-stellige Stunde in 24-Stunden-Notation formatiert ist. Diese Zeit kann sich von der im Dateiinhalt aufgezeichneten Ereigniszeit unterscheiden. Beim Arbeiten mit CDF-Dateien werden Sie manchmal feststellen, dass Ihr S3-Bucket für eine bestimmte Stunde leer ist. Ein leerer Behälter bedeutet, dass er eine der folgenden Bedeutungen haben kann:
  • Für diese bestimmte Stunde liegen keine Daten vor.
  • Unsere Server sind stark ausgelastet und können Dateien für eine bestimmte Stunde nicht verarbeiten. Wenn der Server den Upload aufnimmt, werden die Dateien, die in frühere Zeitbehälter-Dateien hätte aufgenommen werden sollen, in einen Bucket mit einem späteren Zeitwert eingefügt. Dies wird beispielsweise angezeigt, wenn eine Datei, die in der Gruppe "Stunde 17"enthalten sein sollte, im Bucket "Stunde 18"angezeigt wird (mit hour=18 im Dateinamen). In diesem Fall hat der Server wahrscheinlich mit der Verarbeitung Ihrer Datei in Stunde 17 begonnen, konnte sie jedoch nicht innerhalb dieses Zeitintervalls abschließen. Stattdessen wird die Datei an den nächsten stündlichen Zeitbehälter gesendet.

Wichtig: Verwenden Sie nicht den Zeitstempel des Dateinamens, um Ereignisse nach Zeit zu gruppieren. Wenn Sie eine Gruppierung nach Zeit durchführen müssen, verwenden Sie den Zeitstempel EventTime im Dateiinhalt.
Dateiinhalt Der Zeitstempel in Ihrem CDF-Dateiinhalt markiert den Zeitpunkt, zu dem Data Collection Servers mit der Verarbeitung der Datei begonnen hat. Dieser Zeitstempel wird in der Zeitzone UTC festgelegt. Es wird das Feld EventTime verwendet, wobei die Zeit als yyyy-mm-dd hh:mm:ss formatiert ist. Diese Zeit entspricht in etwa der tatsächlichen Zeit des Ereignisses auf der Seite, kann sich jedoch von der Stundenanzeige im Dateinamen unterscheiden.
Tipp: Im Gegensatz zum hour= Zeitstempel im Dateinamen können Sie EventTime zum Gruppieren von Daten nach Zeit verwenden.

Auf dieser Seite