Customer Data Feeds

Grundlegende Informationen Customer Data Feed (CDF) Dateien und Anweisungen zu den ersten Schritten. Beginnen Sie hier, wenn Sie Interesse haben CDF oder Sie benötigen einfach weitere Informationen.

Dateiinhalt und Zweck

Eine CDF-Datei enthält dieselben Daten, die ein Audience Manager-Ereignisaufruf (/event) an unsere Server sendet. Dazu gehören Daten wie Benutzer-IDs, trait IDs, segment IDsund alle anderen Parameter, die von einem Ereignisaufruf erfasst werden. intern Audience Manager Systeme verarbeitet Ereignisdaten in einer CDF -Datei mit Inhalten, die in Feldern angeordnet sind, die in einer bestimmten Reihenfolge angezeigt werden. Audience Manager Versuche, CDF Dateien stündlich speichern und in einem sicheren, kundenspezifischen Behälter auf einem Amazon S3 Server. Wir stellen diese Dateien bereit, damit Sie mit Audience Manager Daten außerhalb der durch unsere Benutzeroberfläche festgelegten Grenzen.

WICHTIG

Beachten Sie beim Arbeiten mit CDF-Dateien die folgenden Einschränkungen:

  • Stellen Sie vor der Einrichtung der CDF-Dateibereitstellung sicher, dass Sie über die entsprechenden Berechtigungen von Drittanbietern für den Export von Eigenschaften von Drittanbietern verfügen. Audience Manager unterstützt derzeit keine Funktionalität in der Benutzeroberfläche, um die Exportberechtigung für CDF-Dateien von Datenanbietern von Drittanbietern anzufordern. Wenden Sie sich daher an diese unabhängig.
  • Sie sollten CDF -Dateien als Proxy zur Überwachung des Seitenverkehrs, zur Abstimmung von Berichtsdiskrepanzen oder zur Rechnungsstellung usw.

Erste Schritte

Es gibt keinen zu startenden Self-Service-Prozess CDF Dateibereitstellung. Wenden Sie sich an Audience Manager -Berater oder Kundenunterstützung . Während der Implementierung Audience Manager wird

  • Richten Sie Ihre Amazon S3 Speicherbehälter.
  • Schreibgeschützt bereitstellen S3 Authentifizierungsberechtigungen für Ihren Dateispeicherbehälter. Sie können Verzeichnisse und Dateien, die zu anderen Kunden gehören, nicht sehen oder darauf zugreifen.

Dateibenachrichtigungen und CDF -Dateien werden in S3 Bucket, wenn sie zum Download bereit sind. Sie sind für die Überwachung und das Herunterladen von Dateien von Ihrem zugewiesenen S3 Verzeichnis. Siehe Verarbeitungsbenachrichtigungen für CDF-Dateien.

Nächste Schritte

Die folgenden Abschnitte und die Häufig gestellte Fragen zu Kundendaten-Feeds kann Ihnen dabei helfen, sich mit diesem Dienst besser vertraut zu machen.

Customer Data Feed Definierte Inhalte

Listet die Datenelemente und Arrays auf und definiert sie in einer CDF -Datei in der Reihenfolge ihres Erscheinungsbilds. Definitionen umfassen Datentypen, diese Informationen sind jedoch nicht Teil eines CDF -Datei.

Definitionen

A CDF enthält einige oder alle unten definierten Felder. Informationen zur internen Dateiorganisation finden Sie unter Dateistruktur des Kundendaten-Feeds.

Feld Datentyp Beschreibung

Event Time

Zeitstempel

Der Zeitpunkt, zu dem eine CDF-Datei von der Datenerfassungsserver (DCS). Der Zeitstempel verwendet die yyyy-mm-dd hh:mm:ss und wird in der UTC-Zeitzone festgelegt.

Hinweis: Die Ereigniszeit ist nicht:

Device

Zeichenfolge

Dies ist die Eindeutige Benutzer-ID (UUID), eine 38-stellige Geräte-ID für Ihren Site-Besucher. Weitere Informationen finden Sie unter Index of IDs in Audience Manager.

Container ID

Numerisch

Die ID des Containers, der ID-Synchronisierungen auslöst.

Realized Traits

Numerisches Array

Ein Array von Eigenschaften-IDs, die alle Eigenschaften enthalten, die ein Besucher im Ereignisaufruf realisiert (für die er qualifiziert ist) hat.

Beachten Sie, dass das -Array Eigenschaften enthalten kann, für die sich der Besucher zuvor qualifiziert hatte und für die er sich durch diesen Ereignisaufruf erneut qualifiziert hat.

Realized Segments

Numerisches Array

Ein Array von Segment-IDs, die alle Segmente enthalten, die ein Besucher im Ereignisaufruf realisiert (für die er qualifiziert ist) hat.

Request Parameters

Zeichenfolge

Eine Zeichenfolge, die alle Parameter erfasst (Variablen, IDs, Schlüssel-Wert-Paare, Geräte-Werbe-IDs usw.) beim Ereignisaufruf übergeben wird.

Kurzes Beispiel:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type

Zeichenfolge

Die nicht kodierte URL der verweisenden Seite (falls vorhanden).

IP Data Type

Zeichenfolge

Die IP-Adresse des Besuchers, der im Ereignisaufruf erfasst wurde.

MCDevice

Zeichenfolge

Die Experience Cloud Dem Site-Besucher zugewiesene ID (MID). Siehe auch Cookies und der Adobe Experience Platform Identity-Dienst.

All Segments

Numerisches Array

Ein Array von Segment-IDs, die zuvor realisierte Segmente und neue Segmente enthalten, für die der Besucher qualifiziert ist.

All Traits

Numerisches Array

Ein Array von Erstanbieter- und Drittanbieter-Eigenschafts-IDs, die zuvor realisierte Eigenschaften und neue Eigenschaften enthalten, für die sich der Besucher seit dem letzten generierten Daten-Feed qualifiziert hat.

Customer Data Feed Dateistruktur

Listet die Datenstruktur einer CDF -Datei. Dazu gehören Datensequenz, Feldtrennzeichen und Trennzeichen, eine Datendateizuordnung und eine Beispieldatei.

Datenfeld-IDs und -Sequenzen

CDF -Dateien enthalten keine gekennzeichneten Spalten oder Feldkopfzeilen. Stattdessen wird eine CDF -Datei definiert Felder und Arrays ohne Drucken ASCII Zeichen. Außerdem wird die CDF -Datei listet jedes Feld und Array in einer bestimmten Reihenfolge auf. Mithilfe der Kennungen und der Reihenfolge der Felder können Sie die Datei richtig analysieren.

CDF-Dateielement Beschreibung

Feldtrennzeichen und -trennzeichen

Diese nicht druckbaren Zeichen definieren die Elemente und die Struktur Ihrer CDF-Datei:

  • Strg + A (ASCII) 001 oder ^A) trennt die Daten in einzelnen Feldern mit einer nicht druckbaren Leerzeichen.
  • Strg + B (ASCII) 002 oder ^B) trennt Daten, ein Array und Anforderungsparameter.
  • Strg + C (ASCII) 003 oder ^C) definiert Schlüssel-Wert-Paare.

Feldsequenz

Wichtig: Audience Manager behält sich das Recht vor, neue Felder am Ende der CDF-Datei in zukünftigen Versionen hinzuzufügen. Das bedeutet, dass das technische Design Ihres Dateianalysesystems keine feste Anzahl von Spalten annehmen sollte (obwohl es eine feste Reihenfolge für vorhandene Spalten annehmen kann).

Daten in Ihrer CDF-Datei werden in der unten gezeigten Reihenfolge angezeigt. /N kann anstelle eines dieser Felder angezeigt werden, was einen Nullwert angibt.

  1. Ereigniszeit
  2. Gerät
  3. Behälter-ID
  4. Realisierte Eigenschaften
  5. Realisierte Segmente
  6. Anfrageparameter
  7. Referer
  8. IP-Adresse
  9. Experience Cloud Device ID (oder MID). Siehe auch Cookies und der Adobe Experience Platform Identity-Dienst
  10. Alle Segmente
  11. Alle Eigenschaften

Feldbeschreibungen finden Sie unter Definierte Kundendaten-Feed-Inhalte.

CDF Dateizuordnung

CDF -Dateidaten werden in der unten gezeigten Reihenfolge angezeigt.

Identifizieren von Arrays

Arrays in einer CDF -Datei beginnen und enden mit der Ctrl + a Feldtrennzeichen. Dadurch wird das erste Element in einem Array wie ein eigenständiges Datenfeld angezeigt. Beispielsweise wird die traits Array beginnt mit ^A1234. Array-Trennzeichen und -ID ^B5678 folgt diesem Eintrag. Daher könnten Sie versucht sein, zu glauben, dass das erste Element in der traits Array ist ID 5678 (da es mit ^B). Dies ist nicht der Fall. Daher müssen Sie mit der Sequenz und Struktur einer Datendatei vertraut sein. Auch wenn das erste Element im realisiert wurde trait Array (oder eines der anderen Arrays in einer CDF -Datei) beginnt mit ^A, definiert die Reihenfolge des Erscheinungsbilds oder der Position in der Datei den Beginn eines Arrays. Und das erste Element in einem Array wird immer vom vorherigen Eintrag durch ^A.

Beispiel CDF Datei

Beispiel CDF -Datei in etwa wie folgt aussehen. Wir haben Zeilenumbrüche in dieses Beispiel eingefügt, damit es an die Seite angepasst werden kann.

Customer Data Feed Namenskonventionen für Dateien

In den folgenden Abschnitten werden die Elemente in der CDF Dateiname.

CDF Dateiname: Syntax und Beispiel

Eine typische CDF Der Dateiname enthält die unten aufgeführten Elemente. Hinweis: kursiv gibt einen Variablenplatzhalter an:

Syntax

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Beispiel

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

In S3 -Speicher, werden die Dateien in aufsteigender Reihenfolge nach Partner-ID (PID), Tag und Stunde.

CDF Definierte Dateinamenelemente

In der folgenden Tabelle sind die Elemente in einer CDF Dateiname.

Dateinamenelement Beschreibung

s3://aam-cdf/

Dies ist der standardmäßige Stammspeicherbehälter für Ihre CDF-Datei auf einem Amazon S3-Server.

your S3 bucket name

Der Name des schreibgeschützten S3-Buckets, der Ihre CDF-Dateien enthält.

day=yyyy-mm-dd

Das Datum, an dem Ihre Datei verarbeitet wurde.

hour=hh

Ein Zeitwert, der in 24-Stunden-Notation ausgedrückt und in der UTC-Zeitzone festgelegt wird. Siehe auch Zeitpunkte der Kundendaten-Feed-Datei und Zeiten des Dateiinhalts ....

partner ID

Ihre Partner-ID.

File Sequence_0

Werte, die die Dateisequenz angeben. Die Sequenz erhöht sich wie folgt: 0_0_0 , 0_1_0, 0_2_0 ....1_0_0

.gz

Eine gzip-Dateierweiterung. CDF-Dateien sind gzip-komprimiert.

Customer Data Feed Dateiverarbeitungsbenachrichtigungen

Audience Manager schreibt eine .info Datei S3 -Verzeichnis, über das Sie erfahren können, wann Ihre Customer Data File (CDF) kann heruntergeladen werden. Die .info auch JSON formatierte Metadaten zum Inhalt Ihrer CDF Dateien. In diesem Abschnitt finden Sie Informationen zur Syntax und zu den Feldern, die von dieser Benachrichtigungsdatei verwendet werden.

Beispiel-Info-Datei

Jeder .info -Datei enthält Files und Totals Abschnitt. Die Files -Abschnitt enthält ein Array, das spezifische Metriken für jede stündliche Datei enthält. Die Totals enthält Metriken, die über all Ihre CDF -Dateien für einen bestimmten Tag. Der Inhalt Ihrer .info -Datei ähnlich wie im folgenden Beispiel aussehen.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Definierte Informationsdateifelder

In den folgenden Tabellen sind die Elemente aufgelistet und in einer CDF .info -Datei.

Dateiobjekt

Feld Beschreibung

Files

Startet das Array, das Metadaten zu Ihren CDF-Dateien enthält.

FileByteSize

Dateigröße in Byte.

FileChecksumMD5

Das Amazon S3 ETag. Die Zahl nach dem Bindestrich zeigt die Anzahl der Teile an, die zum Erstellen der Datei während des mehrteiligen Uploads verwendet wurden. Die ETag ist nicht mit der MD5-Prüfsumme der Datei identisch.

FileName

Der Dateiname. Siehe Namenskonventionen für CDF-Dateien.

FileSequenceNumber

Eine Indexnummer für jede Datei.

Gesamtobjekt

Feld Beschreibung

Totals

Startet das Objekt, das aggregierte Daten zu allen CDF-Dateien enthält.

Day

Der Tag, für den die Daten verfügbar sind. Verwendet yyyy-mm-dd Format.

Hour

Die Stunde, für die Daten verfügbar sind. Verwendet das in der UTC-Zeitzone eingestellte 24-Stunden-Format.

TotalByteSize

Gesamtgröße aller CDF-Dateien für dieses Datum in Byte.

TotalNumberFiles

Gesamtzahl der in das S3-Verzeichnis hochgeladenen Dateien.

Customer Data Feed Dateinamenzeiten und Dateiinhaltszeiten sind unterschiedlich

Ihre CDF enthält Zeitstempel im Dateinamen und Dateiinhalt. Diese Zeitstempel zeichnen unterschiedliche Ereignisprozesse für dieselben auf CDF -Datei. Es ist nicht ungewöhnlich, verschiedene Zeitstempel im Namen und Inhalt derselben Datei zu sehen. Die Kenntnis jedes Zeitstempels kann Ihnen dabei helfen, häufige Fehler beim Arbeiten mit diesen Daten oder beim Versuch, sie nach Zeit zu sortieren, zu vermeiden.

Standort CDF Datei-Zeitstempel

CDF -Dateien verzeichnen die Zeit an zwei verschiedenen Speicherorten unterschiedlich.

Unterschiede zwischen Zeitstempeln verstehen

Die folgende Tabelle enthält weitere Details zu Ihrer CDF Datei-Zeitstempel sowie Informationen zu ihrer ordnungsgemäßen Verwendung.

Zeitstempelstandort Beschreibung
Dateiname Der Zeitstempel in Ihrer CDF Dateiname gibt die Zeit an, zu der Audience Manager hat begonnen, Ihre Datei für den Versand vorzubereiten. Dieser Zeitstempel wird im UTC Zeitzone. Sie verwendet die hour= , wobei die Zeit als 2-stellige Stunde in 24-Stunden-Notation formatiert ist. Diese Zeit kann sich von der im Dateiinhalt aufgezeichneten Ereigniszeit unterscheiden. Beim Arbeiten mit CDF -Dateien, manchmal werden Sie feststellen, dass Ihre S3 für eine bestimmte Stunde leer ist. Ein leerer Behälter bedeutet, dass er eine der folgenden Bedeutungen haben kann:
  • Für diese bestimmte Stunde liegen keine Daten vor.
  • Unsere Server sind stark ausgelastet und können Dateien für eine bestimmte Stunde nicht verarbeiten. Wenn der Server den Upload aufnimmt, werden die Dateien, die in frühere Zeitbehälter-Dateien hätte aufgenommen werden sollen, in einen Bucket mit einem späteren Zeitwert eingefügt. Dies wird beispielsweise angezeigt, wenn eine Datei, die in der Gruppe "Stunde 17"enthalten sein sollte, in der Gruppe "Stunde 18"angezeigt wird (mit hour=18 im Dateinamen). In diesem Fall hat der Server wahrscheinlich mit der Verarbeitung Ihrer Datei in Stunde 17 begonnen, konnte sie jedoch nicht innerhalb dieses Zeitintervalls abschließen. Stattdessen wird die Datei an den nächsten stündlichen Zeitbehälter gesendet.

Wichtig: Verwenden Sie nicht den Zeitstempel des Dateinamens, um Ereignisse nach Zeit zu gruppieren. Wenn Sie eine Gruppe nach Zeit erstellen müssen, verwenden Sie die EventTime Zeitstempel im Dateiinhalt.
Dateiinhalt Der Zeitstempel in Ihrer CDF Der Dateiinhalt gibt die Zeit an, zu der die Data Collection Servers hat die Verarbeitung der Datei gestartet. Dieser Zeitstempel wird im UTC Zeitzone. Sie verwendet die EventTime -Feld, wobei die Uhrzeit als yyyy-mm-dd hh:mm:ss. Diese Zeit entspricht in etwa der tatsächlichen Zeit des Ereignisses auf der Seite, kann sich jedoch von der Stundenanzeige im Dateinamen unterscheiden.
Tipp: Im Gegensatz zu hour= Zeitstempel im Dateinamen können Sie EventTime um Daten nach Zeit zu gruppieren.

Auf dieser Seite