Customer Data Feeds customer-data-feeds

Basisinformatie over Customer Data Feed (CDF) dossiers en instructies over hoe te beginnen. Begin hier als u geïnteresseerd bent in het ontvangen van CDF bestanden of meer informatie wilt.

Bestandsinhoud en doel file-contents-purpose

Een CDF -bestand bevat dezelfde gegevens als een Audience Manager gebeurtenisaanroep ( /event ) naar onze servers verzendt. Dit zijn gegevens zoals gebruikers-id's trait IDs , segment IDs en alle andere parameters die door een gebeurtenisaanroep zijn vastgelegd. Interne Audience Manager -systemen verwerken gebeurtenisgegevens in een CDF -bestand met inhoud die is ingedeeld in velden die in een ingestelde volgorde worden weergegeven. Audience Manager probeert CDF -bestanden per uur te genereren en slaat deze op in een beveiligd, klantspecifiek emmertje op een Amazon S3 -server. Deze bestanden zijn beschikbaar zodat u met Audience Manager -gegevens kunt werken die buiten de door de gebruikersinterface opgelegde beperkingen vallen.

IMPORTANT
Houd rekening met de volgende beperkingen wanneer u werkt met CDF-bestanden:
  • Voordat u CDF-bestandslevering instelt, moet u ervoor zorgen dat u over de juiste machtigingen van externe gegevensleveranciers beschikt voor het exporteren van externe traits. Audience Manager biedt momenteel geen ondersteuning voor functionaliteit in de gebruikersinterface voor het aanvragen van CDF-toestemming voor het exporteren van bestanden van gegevensleveranciers van derden. Neem daarom een onafhankelijk contact op met deze leveranciers.
  • Gebruik CDF -bestanden niet als proxy voor het controleren van het paginaverkeer, het afstemmen van verschillen in rapporten of voor facturering, enzovoort.

Aan de slag getting-started

Er is geen zelfbedieningsproces om de levering van CDF bestanden te starten. Neem contact op met uw Audience Manager consultant of de klantenservice om aan de slag te gaan. Tijdens de implementatie zal uw Audience Manager -vertegenwoordiger:

  • Stel uw opslagemmertje voor Amazon S3 in.
  • Geef alleen-lezen S3 verificatiereferenties op voor uw opslagemmertje voor bestanden. U kunt geen mappen en bestanden zien of openen die bij andere klanten horen.

Bestandsmeldingen en CDF -bestanden worden weergegeven in uw S3 -emmertje wanneer ze kunnen worden gedownload. U bent verantwoordelijk voor het controleren en downloaden van bestanden vanuit de toegewezen S3 -map. Zie Voortgangsmeldingen voor klantdatafeedbestanden.

Volgende stappen next-steps

De secties hieronder en Veelgestelde Veelgestelde vragen van het voer van de Gegevens van de Klantkunnen u helpen vertrouwd met deze dienst worden.

Customer Data Feed Gedefinieerde inhoud cdf-defined

Hiermee geeft u de gegevenselementen en arrays in een CDF -bestand op volgorde van weergave weer en definieert u deze. Definities omvatten gegevenstypen, maar deze informatie maakt geen deel uit van een CDF -bestand.

IMPORTANT
Gebeurtenispixels worden standaard uitgesloten in CDF-configuraties. Zorg ervoor dat u in uw verzoek aan de klantenzorg specificeert als u gebeurtenispixel om in uw CDF- dossiers wilt worden omvat. Elke gebeurtenispixel wordt als een unieke rij in uw CDF-bestanden gevuld.

Definities definitions

Een CDF -bestand bevat enkele of alle hieronder gedefinieerde velden. Voor informatie over interne dossierorganisatie, zie {de Structuur van het Dossier van het Dossier van het Gegevensvoer van 0} Klant .

Veld
Datatype
Beschrijving
Event Time
Tijdstempel

De tijd een CDF- dossier werd verwerkt door de Servers van de Inzameling van Gegevens (DCS). De timestamp gebruikt jjjj-mm-dd hh ss formaat en wordt geplaatst in de UTC tijdzone.

Nota: De tijd van de Gebeurtenis is niet :

Device
String
Dit is de Unieke identiteitskaart van de Gebruiker (UUID), die een 38 cijferige apparatenidentiteitskaart voor uw plaatsbezoeker is. Zie ook, Index van identiteitskaarts in Audience Manager.
Container ID
Numeriek
De id van de container die de syncs van ID in brand brengt. Dit gebied bevolkt slechts als u containeridentiteitskaart op het d_nsid gebied binnen uw plaatsimplementatie plaatst. Anders wordt de standaardwaarde 0 niet opgenomen in CDF-bestanden.
Realized Traits
Numerieke array

Een array met referentie-id's die alle kenmerken bevat die een bezoeker heeft gerealiseerd (gekwalificeerd voor) in de gebeurtenisaanroep.

De array kan kenmerken bevatten waarvoor de bezoeker eerder had gekwalificeerd en waarvoor ze via deze gebeurtenisaanroep opnieuw in aanmerking kwamen.

Realized Segments
Numerieke array
Een array van segment-id's die alle segmenten bevat die een bezoeker heeft gerealiseerd (gekwalificeerd voor) in de gebeurtenisaanroep.
Request Parameters
String

Een tekenreeks die alle parameters vastlegt (variabelen, id's, sleutelwaardeparen, id's voor apparaatreclame, enz.) die in de gebeurtenisaanroep zijn doorgegeven.

Verkort voorbeeld:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
String
De niet-gecodeerde URL van de verwijzende pagina (indien aanwezig).
IP Data Type
String
Het IP-adres van de bezoeker die is vastgelegd in de gebeurtenisaanroep.
MCDevice
String
De Experience Cloud -id (MID) die aan de sitebezoeker is toegewezen. Zie ook, Cookies en de Dienst van de Identiteit van Adobe Experience Platform.
All Segments
Numerieke array
Een array van segment-id's die eerder gerealiseerde segmenten en nieuwe segmenten bevat waarvoor de bezoeker in aanmerking komt.
All Traits
Numerieke array
Een array met ID's van het eerste en het derde kenmerk die eerder gerealiseerde kenmerken en nieuwe kenmerken bevat waarvoor de bezoeker zich heeft gekwalificeerd sinds de laatste gegenereerde gegevensfeed.

Customer Data Feed Bestandsstructuur cdf-file-structure

Hiermee geeft u de gegevensstructuur van een CDF -bestand weer en definieert u deze. Dit omvat gegevensreeksen, gebiedsscheidingen en scheidingstekens, een kaart van het gegevensdossier, en steekproefdossier.

Id's en volgorde van gegevensvelden identifiers-and-sequence

CDF -bestanden bevatten geen gelabelde kolommen of veldkoppen. In plaats daarvan definieert een CDF -bestand velden en arrays met niet-afdrukbare ASCII -tekens. Bovendien worden in het bestand CDF elk veld en elke array in een specifieke volgorde weergegeven. Als u de veld-id's en de volgorde begrijpt, kunt u het bestand op de juiste wijze parseren.

CDF-bestandselement
Beschrijving
Veldscheidingstekens en scheidingstekens

Deze niet-afdrukbare tekens definiëren de elementen en structuur van het CDF-bestand:

  • Met Ctrl + a (ASCII 001 of ^A ) worden gegevens in afzonderlijke velden gescheiden door een niet-afdrukbare spatie-indicator.
  • Met Ctrl + b (ASCII 002 of ^B ) worden gegevens en array- en aanvraagparameters van elkaar gescheiden.
  • Ctrl + c (ASCII 003 of ^C ) definieert sleutelwaardeparen.
Veldvolgorde

Belangrijk: Audience Manager behoudt zich het recht voor om nieuwe velden toe te voegen aan het einde van het CDF-bestand in toekomstige versies. Dit betekent het technische ontwerp van uw dossier het ontleden systeem niet een vast aantal kolommen zou moeten veronderstellen (hoewel het een vaste orde voor bestaande kolommen kan veronderstellen).

De gegevens in uw CDF-bestand worden weergegeven in de onderstaande volgorde. /N kan in plaats van om het even welk van deze gebieden verschijnen, wijzend op een ongeldige waarde.

  1. Gebeurtenistijd
  2. Apparaat
  3. Container-id
  4. Realistische kenmerken
  5. Geregistreerde segmenten
  6. Parameters aanvragen
  7. Verwijzing
  8. IP-adres
  9. Experience Cloud Device ID (of MID). Zie ook, Cookies en de Dienst van de Identiteit van Adobe Experience Platform
  10. Alle segmenten
  11. Alle sporen

Voor gebiedsbeschrijvingen, zie Gedefinieerde Inhoud van de Diervoeders van de Gegevens van de Klant.

CDF Bestandstoewijzing cdf-file-map

CDF -bestandsgegevens worden weergegeven in de onderstaande volgorde.

Arrays identificeren

Arrays in een CDF -bestand beginnen en eindigen met het Ctrl + a -veldscheidingsteken. Hierdoor lijkt het eerste element in een array op een zelfstandig gegevensveld. De gerealiseerde array traits begint bijvoorbeeld met ^A1234 . Deze vermelding wordt gevolgd door het scheidingsteken voor arrays en de id ^B5678 . Hierdoor kan het lijken alsof het eerste element in de gerealiseerde array traits ID 5678 is (omdat het begint met ^B ). Dit is niet het geval, en daarom moet u met de opeenvolging en de structuur van een gegevensdossier vertrouwd zijn. Hoewel het eerste element in de gerealiseerde trait -array (of een van de andere arrays in een CDF -bestand) begint met ^A , definieert de volgorde van weergave of positie in het bestand het begin van een array. En het eerste element in een array wordt altijd gescheiden van de vorige vermelding door ^A .

Voorbeeld van CDF bestand sample-file

Een voorbeeldbestand CDF kan er ongeveer als volgt uitzien. In dit voorbeeld zijn regeleinden ingevoegd om deze aan te passen aan de pagina.

Customer Data Feed Naamgevingsconventies voor bestanden cdf-naming-conventions

In de onderstaande secties worden de elementen in de bestandsnaam CDF weergegeven en gedefinieerd.

CDF Bestandsnaam: Syntaxis en voorbeeld cdf-file-name

Een typische CDF -bestandsnaam bevat de onderstaande elementen. Nota, cursief wijst op veranderlijke placeholder:

Syntaxis

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Voorbeeld

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

In uw S3 opslagemmer, worden de dossiers gesorteerd in stijgende orde door identiteitskaart van de Partner (PID), dag, en uur.

CDF Bestandsnaamelementen gedefinieerd cdf-file-name-elements

In de volgende tabel worden de elementen in een bestandsnaam van CDF weergegeven en gedefinieerd.

Bestandsnaamelement
Beschrijving
s3://aam-cdf/
Dit is het standaard, basisopslagemmertje voor uw CDF- dossier op een server van Amazon S3.
your S3 bucket name
De naam van het read-only, S3 emmertje dat uw CDF dossiers houdt.
day=yyyy-mm-dd
De datum waarop het bestand is verwerkt.
hour=hh
Een tijdwaarde uitgedrukt in notatie van 24 uur en ingesteld in de tijdzone UTC. Zie ook Tijdstippen voor bestandsnamen en tijden voor bestandsinhoud voor klantgegevens... .
partner ID
Je partner-id.
File Sequence_0
Waarden die de bestandsreeks identificeren. De reeks wordt als volgt verhoogd: 0_0_0, 0_1_0, 0_2_0...1_0_0
.gz
Een gzip-bestandsextensie. CDF-bestanden worden gecomprimeerd met gzip.

Customer Data Feed Meldingen voor bestandsverwerking cdf-file-processing-notifications

Audience Manager schrijft een .info bestand naar de map S3 om u te laten weten wanneer uw Customer Data File (CDF) klaar is om te worden gedownload. Het .info -bestand bevat ook JSON opgemaakte metagegevens over de inhoud van uw CDF -bestanden. Controleer deze sectie voor informatie over de syntaxis en de gebieden die door dit berichtdossier worden gebruikt.

Voorbeeldgegevensbestand sample-info-file

Elk .info -bestand bevat een sectie Files en Totals . De sectie Files bevat een array met specifieke meetgegevens voor elk uurbestand. De sectie Totals bevat meetgegevens die voor een bepaalde dag in al uw CDF -bestanden zijn samengevoegd. De inhoud van het .info -bestand kan er ongeveer als volgt uitzien.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Gedefinieerde gegevensbestandsvelden info-file-fields-defined

In de volgende tabellen worden de elementen in een CDF .info -bestand weergegeven en gedefinieerd.

Bestandsobject

Veld
Beschrijving
Files
Start de array die metagegevens over uw CDF-bestanden bevat.
FileByteSize
Bestandsgrootte in bytes.
FileChecksumMD5
De Amazon S3 ETag. Het nummer na het koppelteken geeft het aantal onderdelen weer dat wordt gebruikt om het bestand te maken tijdens het uploaden van meerdere onderdelen. De ETag is niet gelijk aan de MD5-controlesom van het bestand.
FileName
De bestandsnaam. Zie Naamgevingsconventies voor bestanden met klantgegevens.
FileSequenceNumber
Een indexnummer voor elk bestand.

Totalen, object

Veld
Beschrijving
Totals
Start het object dat samengevoegde gegevens over al uw CDF-bestanden bevat.
Day
De dag waarvoor de gegevens beschikbaar zijn. Gebruikt jjjj-mm-dd formaat.
Hour
Het uur waarvoor gegevens beschikbaar zijn. Gebruikt een 24-uursnotatie in UTC-tijdzone.
TotalByteSize
De totale grootte van al uw CDF-bestanden voor die datum in bytes.
TotalNumberFiles
Het totale aantal bestanden dat naar uw S3-map is geüpload.

Customer Data Feed De tijden van bestandsnaam en bestandsinhoud zijn anders different-processing-times

Het CDF -bestand bevat tijdstempels in de bestandsnaam en de bestandsinhoud. Deze tijdstempels registreren verschillende gebeurtenisprocessen voor hetzelfde CDF bestand. Het is niet ongebruikelijk om verschillende tijdstempels in de naam en inhoud van het zelfde dossier te zien. Als u een goed begrip van elk tijdstempel hebt, voorkomt u vaak voorkomende fouten wanneer u met deze gegevens werkt of probeert deze op tijd te sorteren.

CDF Tijdstempels van bestand zoeken locating-timestamps

In CDF -bestanden wordt de tijd op twee verschillende locaties vastgelegd.

Het verschil tussen tijdstempels begrijpen understanding-timestamps

In de volgende tabel vindt u aanvullende informatie over de tijdstempels van het bestand CDF , samen met informatie over het correcte gebruik ervan.

Locatie tijdstempel
Beschrijving
Bestandsnaam

Het tijdstempel in de bestandsnaam CDF geeft het tijdstip aan waarop Audience Manager het bestand heeft voorbereid voor levering. Deze tijdstempel wordt ingesteld in de tijdzone UTC . De parameter hour= wordt gebruikt, waarbij de tijd wordt opgemaakt als een uur van 2 cijfers in 24-uursnotatie. Deze tijd kan anders zijn dan de tijd van de gebeurtenis die in de bestandsinhoud is opgenomen. Wanneer u werkt met CDF -bestanden, zult u soms merken dat de S3 -emmertje een bepaald uur leeg is. Onder "lege emmer" wordt verstaan:

  • Er zijn geen gegevens voor dat specifieke uur.
  • Onze servers zijn zwaar belast en kunnen geen dossiers voor een bepaald uur verwerken. Wanneer de server omhoog vangt, zet het de dossiers die in een vroegere dossiers van het tijdemmertje in een emmer met een recentere tijdwaarde zouden moeten zijn gegaan. U ziet dit bijvoorbeeld wanneer een bestand dat in het emmertje van 17 uur had moeten staan, wordt weergegeven in het emmertje van 18 uur (met hour=18 in de bestandsnaam). In dit geval is de server waarschijnlijk begonnen met het verwerken van uw bestand in uur 17, maar kon het bestand niet binnen dat tijdsinterval voltooien. In plaats daarvan wordt het bestand naar het volgende uurtje geduwd.

Belangrijk: Gebruik niet het dossier - noem timestamp om gebeurtenissen tegen tijd te groeperen. Als u wilt groeperen door tijd, gebruik EventTime timestamp in de dossierinhoud.

Bestandsinhoud
Het tijdstempel in de bestandsinhoud CDF geeft de tijd aan dat Data Collection Servers het bestand heeft verwerkt. Deze tijdstempel wordt ingesteld in de tijdzone UTC . Hierbij wordt het veld EventTime gebruikt, met de tijd opgemaakt als yyyy-mm-dd hh:mm:ss . Deze tijd ligt dicht bij de werkelijke tijd van de gebeurtenis op de pagina, maar kan verschillen van de tijdindicator in de bestandsnaam.
Uiteinde: In tegenstelling tot hour= timestamp in het dossier - noem, kunt u EventTime gebruiken om gegevens tegen tijd te groeperen.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695