Customer Data Feeds customer-data-feeds
Basisinformatie over Customer Data Feed (CDF) dossiers en instructies over hoe te beginnen. Begin hier als u geïnteresseerd bent in het ontvangen van CDF bestanden of meer informatie wilt.
Bestandsinhoud en doel file-contents-purpose
Een CDF -bestand bevat dezelfde gegevens als een Audience Manager gebeurtenisaanroep ( /event
) naar onze servers verzendt. Dit zijn gegevens zoals gebruikers-id's trait IDs , segment IDs en alle andere parameters die door een gebeurtenisaanroep zijn vastgelegd. Interne Audience Manager -systemen verwerken gebeurtenisgegevens in een CDF -bestand met inhoud die is ingedeeld in velden die in een ingestelde volgorde worden weergegeven. Audience Manager probeert CDF -bestanden per uur te genereren en slaat deze op in een beveiligd, klantspecifiek emmertje op een Amazon S3 -server. Deze bestanden zijn beschikbaar zodat u met Audience Manager -gegevens kunt werken die buiten de door de gebruikersinterface opgelegde beperkingen vallen.
- Voordat u CDF-bestandslevering instelt, moet u ervoor zorgen dat u over de juiste machtigingen van externe gegevensleveranciers beschikt voor het exporteren van externe traits. Audience Manager biedt momenteel geen ondersteuning voor functionaliteit in de gebruikersinterface voor het aanvragen van CDF-toestemming voor het exporteren van bestanden van gegevensleveranciers van derden. Neem daarom een onafhankelijk contact op met deze leveranciers.
- Gebruik CDF -bestanden niet als proxy voor het controleren van het paginaverkeer, het afstemmen van verschillen in rapporten of voor facturering, enzovoort.
Aan de slag getting-started
Er is geen zelfbedieningsproces om de levering van CDF bestanden te starten. Neem contact op met uw Audience Manager consultant of de klantenservice om aan de slag te gaan. Tijdens de implementatie zal uw Audience Manager -vertegenwoordiger:
- Stel uw opslagemmertje voor Amazon S3 in.
- Geef alleen-lezen S3 verificatiereferenties op voor uw opslagemmertje voor bestanden. U kunt geen mappen en bestanden zien of openen die bij andere klanten horen.
Bestandsmeldingen en CDF -bestanden worden weergegeven in uw S3 -emmertje wanneer ze kunnen worden gedownload. U bent verantwoordelijk voor het controleren en downloaden van bestanden vanuit de toegewezen S3 -map. Zie Voortgangsmeldingen voor klantdatafeedbestanden.
Volgende stappen next-steps
De secties hieronder en Veelgestelde Veelgestelde vragen van het voer van de Gegevens van de Klantkunnen u helpen vertrouwd met deze dienst worden.
Customer Data Feed Gedefinieerde inhoud cdf-defined
Hiermee geeft u de gegevenselementen en arrays in een CDF -bestand op volgorde van weergave weer en definieert u deze. Definities omvatten gegevenstypen, maar deze informatie maakt geen deel uit van een CDF -bestand.
Definities definitions
Een CDF -bestand bevat enkele of alle hieronder gedefinieerde velden. Voor informatie over interne dossierorganisatie, zie {de Structuur van het Dossier van het Dossier van het Gegevensvoer van 0} Klant .
Event Time
De tijd een CDF- dossier werd verwerkt door de Servers van de Inzameling van Gegevens (DCS). De timestamp gebruikt jjjj-mm-dd hh ss formaat en wordt geplaatst in de UTC tijdzone.
Nota: De tijd van de Gebeurtenis is niet :
- De tijd van de paginagebeurtenis of de gebeurtenisvraag zelf, hoewel het aan die tijden kan dicht zijn.
- Heeft betrekking op het DCS-uur in de bestandsnaam. Zie ook Tijdstippen voor bestandsnamen en tijden voor bestandsinhoud voor klantgegevens... .
Device
Container ID
Realized Traits
Een array met referentie-id's die alle kenmerken bevat die een bezoeker heeft gerealiseerd (gekwalificeerd voor) in de gebeurtenisaanroep.
De array kan kenmerken bevatten waarvoor de bezoeker eerder had gekwalificeerd en waarvoor ze via deze gebeurtenisaanroep opnieuw in aanmerking kwamen.
Realized Segments
Request Parameters
Een tekenreeks die alle parameters vastlegt (variabelen, id's, sleutelwaardeparen, id's voor apparaatreclame, enz.) die in de gebeurtenisaanroep zijn doorgegeven.
Verkort voorbeeld:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Customer Data Feed Bestandsstructuur cdf-file-structure
Hiermee geeft u de gegevensstructuur van een CDF -bestand weer en definieert u deze. Dit omvat gegevensreeksen, gebiedsscheidingen en scheidingstekens, een kaart van het gegevensdossier, en steekproefdossier.
Id's en volgorde van gegevensvelden identifiers-and-sequence
CDF -bestanden bevatten geen gelabelde kolommen of veldkoppen. In plaats daarvan definieert een CDF -bestand velden en arrays met niet-afdrukbare ASCII -tekens. Bovendien worden in het bestand CDF elk veld en elke array in een specifieke volgorde weergegeven. Als u de veld-id's en de volgorde begrijpt, kunt u het bestand op de juiste wijze parseren.
Deze niet-afdrukbare tekens definiëren de elementen en structuur van het CDF-bestand:
- Met Ctrl + a (ASCII
001
of^A
) worden gegevens in afzonderlijke velden gescheiden door een niet-afdrukbare spatie-indicator. - Met Ctrl + b (ASCII
002
of^B
) worden gegevens en array- en aanvraagparameters van elkaar gescheiden. - Ctrl + c (ASCII
003
of^C
) definieert sleutelwaardeparen.
Belangrijk: Audience Manager behoudt zich het recht voor om nieuwe velden toe te voegen aan het einde van het CDF-bestand in toekomstige versies. Dit betekent het technische ontwerp van uw dossier het ontleden systeem niet een vast aantal kolommen zou moeten veronderstellen (hoewel het een vaste orde voor bestaande kolommen kan veronderstellen).
De gegevens in uw CDF-bestand worden weergegeven in de onderstaande volgorde. /N kan in plaats van om het even welk van deze gebieden verschijnen, wijzend op een ongeldige waarde.
- Gebeurtenistijd
- Apparaat
- Container-id
- Realistische kenmerken
- Geregistreerde segmenten
- Parameters aanvragen
- Verwijzing
- IP-adres
- Experience Cloud Device ID (of MID). Zie ook, Cookies en de Dienst van de Identiteit van Adobe Experience Platform
- Alle segmenten
- Alle sporen
Voor gebiedsbeschrijvingen, zie Gedefinieerde Inhoud van de Diervoeders van de Gegevens van de Klant.
CDF Bestandstoewijzing cdf-file-map
CDF -bestandsgegevens worden weergegeven in de onderstaande volgorde.
Arrays identificeren
Arrays in een CDF -bestand beginnen en eindigen met het Ctrl + a
-veldscheidingsteken. Hierdoor lijkt het eerste element in een array op een zelfstandig gegevensveld. De gerealiseerde array traits begint bijvoorbeeld met ^A1234
. Deze vermelding wordt gevolgd door het scheidingsteken voor arrays en de id ^B5678
. Hierdoor kan het lijken alsof het eerste element in de gerealiseerde array traits ID 5678 is (omdat het begint met ^B
). Dit is niet het geval, en daarom moet u met de opeenvolging en de structuur van een gegevensdossier vertrouwd zijn. Hoewel het eerste element in de gerealiseerde trait -array (of een van de andere arrays in een CDF -bestand) begint met ^A
, definieert de volgorde van weergave of positie in het bestand het begin van een array. En het eerste element in een array wordt altijd gescheiden van de vorige vermelding door ^A
.
Voorbeeld van CDF bestand sample-file
Een voorbeeldbestand CDF kan er ongeveer als volgt uitzien. In dit voorbeeld zijn regeleinden ingevoegd om deze aan te passen aan de pagina.
Customer Data Feed Naamgevingsconventies voor bestanden cdf-naming-conventions
In de onderstaande secties worden de elementen in de bestandsnaam CDF weergegeven en gedefinieerd.
CDF Bestandsnaam: Syntaxis en voorbeeld cdf-file-name
Een typische CDF -bestandsnaam bevat de onderstaande elementen. Nota, cursief wijst op veranderlijke placeholder:
Syntaxis
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
Voorbeeld
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
In uw S3 opslagemmer, worden de dossiers gesorteerd in stijgende orde door identiteitskaart van de Partner (PID), dag, en uur.
CDF Bestandsnaamelementen gedefinieerd cdf-file-name-elements
In de volgende tabel worden de elementen in een bestandsnaam van CDF weergegeven en gedefinieerd.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed Meldingen voor bestandsverwerking cdf-file-processing-notifications
Audience Manager schrijft een .info
bestand naar de map S3 om u te laten weten wanneer uw Customer Data File (CDF) klaar is om te worden gedownload. Het .info
-bestand bevat ook JSON opgemaakte metagegevens over de inhoud van uw CDF -bestanden. Controleer deze sectie voor informatie over de syntaxis en de gebieden die door dit berichtdossier worden gebruikt.
Voorbeeldgegevensbestand sample-info-file
Elk .info
-bestand bevat een sectie Files
en Totals
. De sectie Files
bevat een array met specifieke meetgegevens voor elk uurbestand. De sectie Totals
bevat meetgegevens die voor een bepaalde dag in al uw CDF -bestanden zijn samengevoegd. De inhoud van het .info
-bestand kan er ongeveer als volgt uitzien.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Gedefinieerde gegevensbestandsvelden info-file-fields-defined
In de volgende tabellen worden de elementen in een CDF .info
-bestand weergegeven en gedefinieerd.
Bestandsobject
Files
FileByteSize
FileChecksumMD5
ETag
is niet gelijk aan de MD5-controlesom van het bestand.FileName
FileSequenceNumber
Totalen, object
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed De tijden van bestandsnaam en bestandsinhoud zijn anders different-processing-times
Het CDF -bestand bevat tijdstempels in de bestandsnaam en de bestandsinhoud. Deze tijdstempels registreren verschillende gebeurtenisprocessen voor hetzelfde CDF bestand. Het is niet ongebruikelijk om verschillende tijdstempels in de naam en inhoud van het zelfde dossier te zien. Als u een goed begrip van elk tijdstempel hebt, voorkomt u vaak voorkomende fouten wanneer u met deze gegevens werkt of probeert deze op tijd te sorteren.
CDF Tijdstempels van bestand zoeken locating-timestamps
In CDF -bestanden wordt de tijd op twee verschillende locaties vastgelegd.
Het verschil tussen tijdstempels begrijpen understanding-timestamps
In de volgende tabel vindt u aanvullende informatie over de tijdstempels van het bestand CDF , samen met informatie over het correcte gebruik ervan.
Het tijdstempel in de bestandsnaam CDF geeft het tijdstip aan waarop Audience Manager het bestand heeft voorbereid voor levering. Deze tijdstempel wordt ingesteld in de tijdzone UTC . De parameter hour=
wordt gebruikt, waarbij de tijd wordt opgemaakt als een uur van 2 cijfers in 24-uursnotatie. Deze tijd kan anders zijn dan de tijd van de gebeurtenis die in de bestandsinhoud is opgenomen. Wanneer u werkt met CDF -bestanden, zult u soms merken dat de S3 -emmertje een bepaald uur leeg is. Onder "lege emmer" wordt verstaan:
- Er zijn geen gegevens voor dat specifieke uur.
- Onze servers zijn zwaar belast en kunnen geen dossiers voor een bepaald uur verwerken. Wanneer de server omhoog vangt, zet het de dossiers die in een vroegere dossiers van het tijdemmertje in een emmer met een recentere tijdwaarde zouden moeten zijn gegaan. U ziet dit bijvoorbeeld wanneer een bestand dat in het emmertje van 17 uur had moeten staan, wordt weergegeven in het emmertje van 18 uur (met
hour=18
in de bestandsnaam). In dit geval is de server waarschijnlijk begonnen met het verwerken van uw bestand in uur 17, maar kon het bestand niet binnen dat tijdsinterval voltooien. In plaats daarvan wordt het bestand naar het volgende uurtje geduwd.
Belangrijk: Gebruik niet het dossier - noem timestamp om gebeurtenissen tegen tijd te groeperen. Als u wilt groeperen door tijd, gebruik EventTime
timestamp in de dossierinhoud.
EventTime
gebruikt, met de tijd opgemaakt als yyyy-mm-dd hh:mm:ss
. Deze tijd ligt dicht bij de werkelijke tijd van de gebeurtenis op de pagina, maar kan verschillen van de tijdindicator in de bestandsnaam.Uiteinde: In tegenstelling tot
hour=
timestamp in het dossier - noem, kunt u EventTime
gebruiken om gegevens tegen tijd te groeperen.