Customer Data Feeds customer-data-feeds
Grundläggande information om Customer Data Feed (CDF) och anvisningar om hur du kommer igång. Börja här om du är intresserad av att få CDF eller bara vill ha mer information.
Filinnehåll och syfte file-contents-purpose
En CDF-fil innehåller samma data som ett Audience Manager-händelseanrop (/event
) skickar till våra servrar. Detta inkluderar data som användar-ID:n, trait IDs, segment IDsoch alla andra parametrar som har hämtats av ett händelseanrop. Intern Audience Manager systemen bearbetar händelsedata till CDF fil med innehåll ordnat i fält som visas i en angiven ordning. Audience Manager försöker generera CDF filer per timme och lagrar dem i en säker, kundspecifik bucket på en Amazon S3 server. Vi tillhandahåller dessa filer så att du kan arbeta med dem Audience Manager data utanför de gränser som våra användargränssnitt har.
- Innan du konfigurerar leveransen av CDF-filer bör du kontrollera att du har rätt behörighet från tredjepartsleverantörer för export av egenskaper från tredje part. Audience Manager stöder för närvarande inte funktioner i användargränssnittet för att begära exporttillstånd för CDF-filer från tredjepartsleverantörer av data, så kontakta dem oberoende av varandra.
- Du ska inte använda CDF filer som en proxy för att övervaka sidtrafik, stämma av rapportavvikelser eller för fakturering osv.
Komma igång getting-started
Det finns ingen självbetjäningsprocess att starta CDF filleverans. Kontakta Audience Manager konsult eller kundtjänst för att komma igång. Under implementeringen kan du Audience Manager kommer att
- Konfigurera Amazon S3 lagringsbucket.
- Ange som skrivskyddad S3 autentiseringsuppgifter för din fillagringshastighet. Du kommer inte att kunna se eller komma åt kataloger och filer som tillhör andra kunder.
Filmeddelanden och CDF filerna visas i S3 när de är klara för nedladdning. Du ansvarar för att övervaka och hämta filer från dina tilldelade S3 katalog. Se Bearbetningsmeddelanden för CDF-filer.
Nästa steg next-steps
avsnitten nedan och Vanliga frågor om kunddataflöden kan hjälpa dig att bli mer bekant med den här tjänsten.
Customer Data Feed Innehåll som definierats cdf-defined
Listar och definierar dataelement och arrayer i en CDF fil, efter utseendeordning. Definitionerna innehåller datatyper, men den här informationen ingår inte i en CDF -fil.
Definitioner definitions
A CDF filen innehåller några eller alla fält som definieras nedan. Mer information om intern filordning finns i Filstruktur för kunddatafeed.
Event Time
Den tid en CDF-fil bearbetades av Datainsamlingsservrar (DCS). Tidsstämpeln använder yyyy-mm-dd hhss format och anges i UTC-tidszonen.
Obs! Händelsetiden är inte:
- Tidpunkten för sidhändelsen eller själva händelsesammanropet, men den kan vara nära den tidpunkten.
- Relaterat till DCS-timmen i filnamnet. Se även Filnamnstider för kunddatafeed och filinnehållstider...
Device
Container ID
Realized Traits
En matris med trait ID:n som innehåller alla egenskaper som en besökare har realiserat (kvalificerat för) i händelseanropet.
Observera att arrayen kan innehålla egenskaper som besökaren har kvalificerat sig för tidigare och för vilka de kvalificerar sig igen genom det här händelseanropet.
Realized Segments
Request Parameters
En sträng som hämtar alla parametrar (variabler, ID:n, nyckelvärdepar, enhets-ID:n med mera) har skickats in i händelseanropet.
Kortare exempel:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Customer Data Feed Filstruktur cdf-file-structure
Visar och definierar datastrukturen för en CDF -fil. Detta inkluderar datasekvens, fältavgränsare och avgränsare, datamappning och exempelfil.
Identifierare och sekvens för datafält identifiers-and-sequence
CDF filer innehåller inte taggade kolumner eller fältrubriker. I stället CDF filen definierar fält och arrayer med icke-utskrivbara ASCII tecken. Dessutom CDF -filen listar varje fält och array i en viss ordning. Genom att förstå fältidentifierarna och ordningen kan du tolka filen korrekt.
Dessa tecken som inte skrivs ut definierar elementen och strukturen i CDF-filen:
- Ctrl + a (ASCII
001
eller^A
) separerar data i enskilda fält med en utrymmesindikator som inte skrivs ut. - Ctrl + b (ASCII
002
eller^B
) avgränsar data i en array och begär parametrar. - Ctrl + c (ASCII
003
eller^C
) definierar nyckelvärdepar.
Viktigt: Audience Manager förbehåller sig rätten att lägga till nya fält i slutet av CDF-filen i framtida versioner. Detta innebär att den tekniska utformningen av filtolkningssystemet inte ska anta ett fast antal kolumner (även om det kan anta en fast ordning för befintliga kolumner).
Data i CDF-filen visas i den ordning som visas nedan. /N kan visas i stället för något av dessa fält, vilket anger ett null-värde.
- Händelsetid
- Enhet
- Behållar-ID
- Realiserade egenskaper
- Realiserade segment
- Begärandeparametrar
- Referent
- IP-adress
- Experience Cloud enhets-ID (eller MID). Se även Cookies och Adobe Experience Platform Identity Service
- Alla segment
- Alla egenskaper
Fältbeskrivningar finns i Innehåll för kunddatafeed definierad.
CDF Filöversikt cdf-file-map
CDF fildata visas i den ordning som visas nedan.
Identifiera arrayer
Arrayer i en CDF filen börjar och slutar med Ctrl + a
fältavgränsare. Detta gör att det första elementet i en array visas som ett fristående datafält. Den traits array börjar med ^A1234
. Arrayavgränsaren och ID:t ^B5678
följer den här posten. Därför kan du vara frestad att tro att det första elementet i traits matrisen är ID 5678 (eftersom den börjar med ^B
). Detta är inte fallet, och därför måste du känna till en datafils sekvens och struktur. Även om det första elementet i trait arrayen (eller någon annan array i en CDF fil) börjar med ^A
definierar utseendeordningen eller placeringen i filen början av en array. Och det första elementet i en array separeras alltid från föregående post med ^A
.
Exempel CDF Fil sample-file
Ett exempel CDF filen kan se ut ungefär så här. Vi har infogat radbrytningar i det här exemplet för att det ska passa in på sidan.
Customer Data Feed Namngivningskonventioner cdf-naming-conventions
Avsnitten nedan listar och definierar elementen i CDF filnamn.
CDF Filnamn: Syntax och exempel cdf-file-name
En typisk CDF filnamnet innehåller de element som anges nedan. Obs! kursiv anger en variabelplatshållare:
Syntax
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
Exempel
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
I S3 lagringsintervall sorteras filerna i stigande ordning efter partner-ID (PID), dag och timme.
CDF Filnamnselement definierade cdf-file-name-elements
I följande tabell listas och definieras elementen i en CDF filnamn.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed Filbearbetningsmeddelanden cdf-file-processing-notifications
Audience Manager skriver en .info
till S3 för att ta reda på när Customer Data File (CDF) kan hämtas. The .info
filen innehåller också JSON formaterade metadata om innehållet i CDF filer. I det här avsnittet finns information om syntaxen och fälten som används i den här meddelandefilen.
Exempelinformationsfil sample-info-file
Varje .info
filen innehåller Files
och Totals
-avsnitt. The Files
-avsnittet innehåller en array som innehåller specifika mått för varje timfil. The Totals
-avsnittet innehåller mätvärden som är sammanställda över hela CDF filer för en viss dag. Innehållet i .info
filen kan se ut ungefär som i följande exempel.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Fält för informationsfil definierade info-file-fields-defined
I följande tabeller listas och definieras elementen i en CDF .info
-fil.
Filobjekt
Files
FileByteSize
FileChecksumMD5
ETag
är inte identisk med filens MD5-kontrollsumma.FileName
FileSequenceNumber
Summobjekt
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed Filnamnstiderna och filinnehållstiderna skiljer sig åt different-processing-times
Dina CDF filen innehåller tidsstämplar i filnamnet och filinnehållet. Dessa tidsstämplar registrerar olika händelseprocesser för samma CDF -fil. Det är inte ovanligt att olika tidsstämplar visas i namnet och innehållet i samma fil. Genom att förstå varje tidsstämpel kan du undvika vanliga misstag när du arbetar med dessa data eller försöker sortera dem efter tid.
Hitta CDF Tidsstämplar locating-timestamps
CDF filer spelar in olika tid på två olika platser.
Förstå skillnaden mellan tidsstämplar understanding-timestamps
I följande tabell finns mer information om CDF tidsstämplar och information om hur de används.
Tidsstämpeln i CDF filnamnet anger när Audience Manager började förbereda filen för leverans. Den här tidsstämpeln anges i UTC tidszon. Den använder hour=
parameter, med tiden formaterad som en tvåsiffrig timme med 24 timmars notation. Den här tiden kan skilja sig från den händelsetid som spelas in i filinnehållet. När du arbetar med CDF filer, ibland märker du att S3 Bucket är tomt under en viss timme. En tom bucket betyder något av följande:
- Det finns inga data för just den timmen.
- Våra servrar är mycket belastade och kan inte bearbeta filer på en viss timme. När servern fångar upp placerar den de filer som borde ha gått in i en tidigare tidsmarkeringsfil i en hink med ett senare tidsvärde. Du kommer till exempel att se det här när en fil som borde ha varit inom timmen 17, visas inom timmen 18, (med
hour=18
i filnamnet). I det här fallet började servern förmodligen bearbeta filen på timme 17, men kunde inte slutföra den inom det tidsintervallet. I stället skickas filen till nästa timtidsintervall.
Viktigt: Använd inte filnamnets tidsstämpel för att gruppera händelser efter tid. Om du behöver gruppera efter tid använder du EventTime
tidsstämpel i filinnehållet.
EventTime
fält, med tid formaterad som yyyy-mm-dd hh:mm:ss
. Den här tiden ligger nära den faktiska tiden för händelsen på sidan, men kan vara en annan än timindikatorn i filnamnet.Tips: Till skillnad från
hour=
tidsstämpel i filnamnet kan du använda EventTime
för att gruppera data efter tid.