Customer Data Feeds customer-data-feeds
Basisinformatie over Customer Data Feed (CDF) en instructies over hoe u aan de slag kunt gaan. Begin hier als je interesse hebt in CDF of meer informatie.
Bestandsinhoud en doel file-contents-purpose
Een CDF-bestand bevat dezelfde data die een Audience Manager-gebeurteniscall (/event
) naar onze servers verzendt. Dit omvat gegevens zoals gebruikers-id's, trait IDs, segment IDsen alle andere parameters die door een gebeurtenisaanroep worden vastgelegd. Intern Audience Manager systemen verwerken gebeurtenisgegevens in een CDF bestand met inhoud die is ingedeeld in velden die in een ingestelde volgorde worden weergegeven. Audience Manager pogingen om te genereren CDF bestanden per uur worden opgeslagen en opgeslagen in een beveiligd, klantspecifiek emmertje op een Amazon S3 server. We bieden deze bestanden zodat u kunt werken met Audience Manager gegevens buiten de grenzen die door onze gebruikersinterface worden opgelegd.
- Voordat u CDF-bestandslevering instelt, moet u ervoor zorgen dat u over de juiste machtigingen van externe gegevensleveranciers beschikt voor het exporteren van externe traits. Audience Manager ondersteunt momenteel geen functionaliteit in de gebruikersinterface om CDF-toestemming voor het exporteren van bestanden van gegevensleveranciers van derden te vragen. Neem daarom een onafhankelijk contact op met deze leveranciers.
- U mag het niet gebruiken CDF bestanden als een proxy om het paginaverkeer te controleren, discrepanties tussen rapporten of facturering op elkaar af te stemmen, enz.
Aan de slag getting-started
Er is geen zelfbedieningsproces om te beginnen CDF bestandslevering. Neem contact op met uw Audience Manager consultant of klantenservice om aan de slag te gaan. Tijdens de implementatie Audience Manager vertegenwoordiger:
- Stel uw Amazon S3 opslagemmer.
- Alleen-lezen opgeven S3 verificatiereferenties naar het opslagemmertje voor bestanden. U kunt geen mappen en bestanden zien of openen die bij andere klanten horen.
Bestandsmeldingen en CDF bestanden worden weergegeven in uw S3 emmertje als ze klaar zijn om te downloaden. U bent verantwoordelijk voor het controleren en downloaden van bestanden van uw toegewezen S3 directory. Zie Voortgangsmeldingen voor klantdatafeedbestanden.
Volgende stappen next-steps
De onderstaande secties en de Veelgestelde vragen over de gegevensfeed van de klant kan u helpen vertrouwd met deze dienst worden.
Customer Data Feed Gedefinieerde inhoud cdf-defined
Hiermee worden de gegevenselementen en arrays in een CDF bestand, op volgorde van weergave. Definities omvatten gegevenstypen, maar deze informatie maakt geen deel uit van een CDF bestand.
Definities definitions
A CDF bevat enkele of alle velden die hieronder worden gedefinieerd. Voor informatie over interne bestandsorganisatie raadpleegt u Bestandsstructuur voor klantgegevens.
Event Time
De tijd dat een CDF-bestand is verwerkt door de Gegevensverzamelingsservers (DCS). De tijdstempel gebruikt de jjjj-mm-dd hhss en wordt ingesteld in de tijdzone UTC.
Opmerking: De tijd van de gebeurtenis is niet:
- De tijd van de paginagebeurtenis of de gebeurtenisvraag zelf, hoewel het aan die tijden kan dicht zijn.
- Heeft betrekking op het DCS-uur in de bestandsnaam. Zie ook: Tijdstippen en tijden van bestandsinhoud voor klantgegevens.
Device
Container ID
Realized Traits
Een array met referentie-id's die alle kenmerken bevat die een bezoeker heeft gerealiseerd (gekwalificeerd voor) in de gebeurtenisaanroep.
De array kan kenmerken bevatten waarvoor de bezoeker eerder had gekwalificeerd en waarvoor ze via deze gebeurtenisaanroep opnieuw in aanmerking kwamen.
Realized Segments
Request Parameters
Een tekenreeks die alle parameters vastlegt (variabelen, id's, sleutelwaardeparen, id's voor apparaatreclame, enz.) overgegaan binnen de gebeurtenisvraag.
Verkort voorbeeld:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Customer Data Feed Bestandsstructuur cdf-file-structure
Hiermee geeft u de gegevensstructuur van een CDF bestand. Dit omvat gegevensreeksen, gebiedsscheidingen en scheidingstekens, een kaart van het gegevensdossier, en steekproefdossier.
Id's en volgorde van gegevensvelden identifiers-and-sequence
CDF bestanden bevatten geen gelabelde kolommen of veldkoppen. In plaats daarvan CDF bestand definieert velden en arrays met niet-afdrukbare ASCII tekens. Ook de CDF elk veld en elke array wordt in een bepaalde volgorde weergegeven. Als u de veld-id's en de volgorde begrijpt, kunt u het bestand op de juiste wijze parseren.
Deze niet-afdrukbare tekens definiëren de elementen en structuur van het CDF-bestand:
- Ctrl + a (ASCII)
001
of^A
) worden gegevens in afzonderlijke velden gescheiden met een niet-afdrukbare ruimte-indicator. - Ctrl + b (ASCII)
002
of^B
) scheidt gegevens en array- en request-parameters. - Ctrl + c (ASCII)
003
of^C
) definieert sleutelwaardeparen.
Belangrijk: Audience Manager behoudt zich het recht voor om nieuwe velden toe te voegen aan het einde van het CDF-bestand in toekomstige versies. Dit betekent het technische ontwerp van uw dossier het ontleden systeem niet een vast aantal kolommen zou moeten veronderstellen (hoewel het een vaste orde voor bestaande kolommen kan veronderstellen).
De gegevens in uw CDF-bestand worden weergegeven in de onderstaande volgorde. /N kan in plaats van om het even welk van deze gebieden verschijnen, wijzend op een ongeldige waarde.
- Gebeurtenistijd
- Apparaat
- Container-id
- Realistische kenmerken
- Geregistreerde segmenten
- Parameters aanvragen
- Verwijzing
- IP-adres
- Experience Cloud Device ID (of MID). Zie ook: Cookies en de Adobe Experience Platform Identity Service
- Alle segmenten
- Alle sporen
Zie voor veldbeschrijvingen Inhoud van feed-gegevens van klant gedefinieerd.
CDF Bestandstoewijzing cdf-file-map
CDF bestandsgegevens worden weergegeven in de volgorde hieronder.
Arrays identificeren
Arrays in een CDF het dossier begint en beëindigt met Ctrl + a
veldscheidingsteken. Hierdoor lijkt het eerste element in een array op een zelfstandig gegevensveld. De gerealiseerde traits array begint met ^A1234
. Arrayscheidingsteken en id ^B5678
volgt deze vermelding. Als gevolg hiervan zou u geneigd kunnen zijn te denken dat het eerste element in gerealiseerde traits array is ID 5678 (omdat deze begint met ^B
). Dit is niet het geval, en daarom moet u met de opeenvolging en de structuur van een gegevensdossier vertrouwd zijn. Hoewel het eerste element in de trait array (of een van de andere arrays in een CDF bestand) begint met ^A
De volgorde van weergave of positie in het bestand definieert het begin van een array. En het eerste element in een array wordt altijd gescheiden van het vorige item door ^A
.
Monster CDF Bestand sample-file
Een monster CDF kan er als volgt uitzien. In dit voorbeeld zijn regeleinden ingevoegd om deze aan te passen aan de pagina.
Customer Data Feed Naamgevingsconventies voor bestanden cdf-naming-conventions
In de onderstaande secties worden de elementen in uw CDF bestandsnaam.
CDF Bestandsnaam: Syntaxis en voorbeeld cdf-file-name
Een standaard CDF de bestandsnaam bevat de onderstaande elementen. Opmerking: cursief Hiermee wordt een tijdelijke aanduiding voor een variabele aangegeven:
Syntaxis
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
Voorbeeld
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
In uw S3 opslagemmer, de dossiers worden gesorteerd in stijgende orde door identiteitskaart van de Partner (PID), dag en uur.
CDF Bestandsnaamelementen gedefinieerd cdf-file-name-elements
In de volgende tabel worden de elementen in een CDF bestandsnaam.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed Meldingen voor bestandsverwerking cdf-file-processing-notifications
Audience Manager schrijft een .info
bestand naar uw S3 directory om u te laten weten wanneer uw Customer Data File (CDF) is klaar om te worden gedownload. De .info
bestand bevat ook JSON opgemaakte metagegevens over de inhoud van uw CDF bestanden. Controleer deze sectie voor informatie over de syntaxis en de gebieden die door dit berichtdossier worden gebruikt.
Voorbeeldgegevensbestand sample-info-file
Elk .info
bestand bevat een Files
en Totals
sectie. De Files
-sectie bevat een array die specifieke meetgegevens bevat voor elk uurbestand. De Totals
sectie bevat cijfers die zijn geaggregeerd voor al uw CDF bestanden voor een bepaalde dag. De inhoud van uw .info
kan er ongeveer als volgt uitzien.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Gedefinieerde gegevensbestandsvelden info-file-fields-defined
In de volgende tabellen worden de elementen in een CDF .info
bestand.
Bestandsobject
Files
FileByteSize
FileChecksumMD5
ETag
is niet gelijk aan de MD5-controlesom van het bestand.FileName
FileSequenceNumber
Totalen, object
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed Tijdstippen voor bestandsnaam en bestandsinhoud verschillen different-processing-times
Uw CDF bevat tijdstempels in de bestandsnaam en de bestandsinhoud. Deze tijdstempels registreren verschillende gebeurtenisprocessen voor hetzelfde CDF bestand. Het is niet ongebruikelijk om verschillende tijdstempels in de naam en inhoud van het zelfde dossier te zien. Als u een goed begrip van elk tijdstempel hebt, voorkomt u vaak voorkomende fouten wanneer u met deze gegevens werkt of probeert deze op tijd te sorteren.
Locatie CDF Tijdstempels voor bestand locating-timestamps
CDF in bestanden wordt de tijd op twee verschillende locaties vastgelegd.
Het verschil tussen tijdstempels begrijpen understanding-timestamps
De volgende tabel bevat aanvullende informatie over uw CDF bestandstijdstempels samen met informatie over het juiste gebruik ervan.
Het tijdstempel in uw CDF bestandsnaam markeert de tijd waarop Audience Manager begon uw bestand voor levering voor te bereiden. Deze tijdstempel wordt ingesteld in het dialoogvenster UTC tijdzone. Het gebruikt de hour=
parameter, met tijd die als 2-cijferig uur in 24-uursnotatie wordt geformatteerd. Deze tijd kan anders zijn dan de tijd van de gebeurtenis die in de bestandsinhoud is opgenomen. Wanneer u werkt met CDF soms zult u merken dat uw S3 emmertje is een bepaald uur leeg. Onder "lege emmer" wordt verstaan:
- Er zijn geen gegevens voor dat specifieke uur.
- Onze servers zijn zwaar belast en kunnen geen dossiers voor een bepaald uur verwerken. Wanneer de server omhoog vangt, zet het de dossiers die in een vroegere dossiers van het tijdemmertje in een emmer met een recentere tijdwaarde zouden moeten zijn gegaan. Bijvoorbeeld, zult u dit zien wanneer een dossier dat in het uur 17 emmertje zou moeten geweest in het uur 18 emmer verschijnen (met
hour=18
in de bestandsnaam). In dit geval is de server waarschijnlijk begonnen met het verwerken van uw bestand in uur 17, maar kon het bestand niet binnen dat tijdsinterval voltooien. In plaats daarvan wordt het bestand naar het volgende uurtje geduwd.
Belangrijk: Gebruik geen tijdstempel voor de bestandsnaam om gebeurtenissen te groeperen. Als u wilt groeperen in tijd, gebruikt u EventTime
tijdstempel in de bestandsinhoud.
EventTime
veld, met tijd opgemaakt als yyyy-mm-dd hh:mm:ss
. Deze tijd ligt dicht bij de werkelijke tijd van de gebeurtenis op de pagina, maar kan verschillen van de tijdindicator in de bestandsnaam.Tip: In tegenstelling tot
hour=
tijdstempel in de bestandsnaam, kunt u EventTime
om gegevens op tijd te groeperen.