Customer Data Feeds customer-data-feeds
Grundläggande information om Customer Data Feed (CDF) filer och anvisningar om hur du kommer igång. Börja här om du vill få CDF filer eller bara vill ha mer information.
Filinnehåll och syfte file-contents-purpose
En CDF-fil innehåller samma data som ett Audience Manager händelseanrop (/event
) skickar till våra servrar. Detta inkluderar data som användar-ID:n, trait IDs, segment IDs och alla andra parametrar som fångats in av ett händelseanrop. Interna Audience Manager-system bearbetar händelsedata till en CDF-fil med innehåll organiserat i fält som visas i en angiven ordning. Audience Manager försöker generera CDF filer per timme och lagrar dem i en säker, kundspecifik bucket på en Amazon S3-server. Vi tillhandahåller dessa filer så att du kan arbeta med Audience Manager-data utanför de gränser som gäller för användargränssnittet.
- Innan du konfigurerar leveransen av CDF-filer bör du kontrollera att du har rätt behörighet från tredjepartsleverantörer för export av egenskaper från tredje part. Audience Manager stöder för närvarande inte funktioner i användargränssnittet för att begära exporttillstånd för CDF-filer från tredjepartsleverantörer av data, så kontakta dem oberoende av varandra.
- Du bör inte använda CDF-filer som proxy för att övervaka sidtrafik, avstämning av rapportavvikelser eller för fakturering osv.
Komma igång getting-started
Det finns ingen självbetjäningsprocess för att starta leveransen av filen CDF. Kontakta din Audience Manager-konsult eller kundtjänst för att komma igång. Under implementeringen kommer din Audience Manager-representant att:
- Konfigurera din Amazon S3-lagringsbucket.
- Ange skrivskyddade autentiseringsuppgifter för S3 till din fillagringsbucket. Du kommer inte att kunna se eller komma åt kataloger och filer som tillhör andra kunder.
Filmeddelanden och CDF filer visas i din S3-bucket när de är klara för hämtning. Du ansvarar för att övervaka och hämta filer från din tilldelade S3-katalog. Se Bearbetningsmeddelanden för CDF-filer.
Nästa steg next-steps
Avsnitten nedan och Vanliga frågor om kunddataflöden kan hjälpa dig att bli mer bekant med den här tjänsten.
Customer Data Feed innehåll har definierats cdf-defined
Visar och definierar dataelement och arrayer i en CDF-fil, efter utseendeordning. Definitioner innehåller datatyper, men den här informationen ingår inte i en CDF-fil.
Definitioner definitions
En CDF-fil innehåller några eller alla fält som definieras nedan. Mer information om intern filordning finns i Filstruktur för kunddatafeed.
Event Time
Den tid en CDF-fil bearbetades av DCS-servrarna (Data Collection Servers). Tidsstämpeln använder formatet åååå-mm-dd hhss och anges i UTC-tidszonen.
Obs! Händelsetiden är inte:
- Tidpunkten för sidhändelsen eller själva händelsesammanropet, även om den kan vara nära den tidpunkten.
- Relaterat till DCS-timmen i filnamnet. Se även Filnamnstider för kunddatafeed och Filinnehållstider....
Device
Container ID
Realized Traits
En matris med trait ID:n som innehåller alla egenskaper som en besökare har realiserat (kvalificerat för) i händelseanropet.
Observera att arrayen kan innehålla egenskaper som besökaren har kvalificerat sig för tidigare och för vilka de kvalificerar sig igen genom det här händelseanropet.
Realized Segments
Request Parameters
En sträng som hämtar alla parametrar (variabler, ID:n, nyckelvärdepar, enhets-ID:n med mera) har skickats in i händelseanropet.
Kortare exempel:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Customer Data Feed Filstruktur cdf-file-structure
Visar och definierar datastrukturen för en CDF-fil. Detta inkluderar datasekvens, fältavgränsare och avgränsare, datamappning och exempelfil.
Identifierare och sekvens för datafält identifiers-and-sequence
CDF filer innehåller inte taggade kolumner eller fältrubriker. I stället definierar en CDF-fil fält och arrayer med ASCII tecken som inte skrivs ut. Dessutom visar filen CDF varje fält och matris i en viss ordning. Genom att förstå fältidentifierarna och ordningen kan du tolka filen korrekt.
Dessa tecken som inte skrivs ut definierar elementen och strukturen i CDF-filen:
- Ctrl + a (ASCII
001
eller^A
) separerar data i enskilda fält med en utrymmesindikator som inte skrivs ut. - Ctrl + b (ASCII
002
eller^B
) separerar data från en array och begär parametrar. - Ctrl + c (ASCII
003
eller^C
) definierar nyckelvärdepar.
Viktigt: Audience Manager förbehåller sig rätten att lägga till nya fält i slutet av CDF-filen i framtida versioner. Detta innebär att den tekniska utformningen av filtolkningssystemet inte ska anta ett fast antal kolumner (även om det kan anta en fast ordning för befintliga kolumner).
Data i CDF-filen visas i den ordning som visas nedan. /N kan visas i stället för något av dessa fält, vilket anger ett null-värde.
- Händelsetid
- Enhet
- Behållar-ID
- Realiserade egenskaper
- Realiserade segment
- Begärandeparametrar
- Referent
- IP-adress
- Experience Cloud enhets-ID (eller MID). Se även cookies och Adobe Experience Platform identitetstjänst
- Alla segment
- Alla egenskaper
Fältbeskrivningar finns i Innehåll för kunddatafeed definierad.
CDF filöversikt cdf-file-map
CDF fildata visas i den ordning som visas nedan.
Identifiera arrayer
Matriser i en CDF-fil börjar och slutar med fältavgränsaren Ctrl + a
. Detta gör att det första elementet i en array visas som ett fristående datafält. Den realiserade traits-matrisen börjar till exempel med ^A1234
. Matrisavgränsaren och ID ^B5678
följer efter den här posten. Det kan därför vara frestande att tro att det första elementet i den realiserade traits-arrayen är ID 5678 (eftersom den börjar med ^B
). Detta är inte fallet, och därför måste du känna till en datafils sekvens och struktur. Även om det första elementet i den realiserade trait-arrayen (eller någon av de andra arrayerna i en CDF -fil) börjar med ^A
, definierar utseendeordningen eller positionen i filen början av en array. Och det första elementet i en array separeras alltid från föregående post med ^A
.
Exempel på CDF-fil sample-file
Ett exempel på en CDF-fil kan se ut ungefär så här. Vi har infogat radbrytningar i det här exemplet för att det ska passa in på sidan.
Customer Data Feed konventioner för namngivning av filer cdf-naming-conventions
Avsnitten nedan listar och definierar elementen i ditt CDF-filnamn.
CDF filnamn: Syntax och exempel cdf-file-name
Ett typiskt CDF-filnamn innehåller elementen som listas nedan. Obs! italics anger en variabelplatshållare:
Syntax
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
Exempel
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
I din S3-lagringsbucket sorteras filerna i stigande ordning efter partner-ID (PID), dag och timme.
CDF filnamnselement har definierats cdf-file-name-elements
I följande tabell visas och definieras elementen i ett CDF-filnamn.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed meddelanden om filbearbetning cdf-file-processing-notifications
Audience Manager skriver en .info
-fil till din S3-katalog för att tala om när Customer Data File (CDF) är klar för hämtning. Filen .info
innehåller även JSON formaterade metadata om innehållet i dina CDF-filer. I det här avsnittet finns information om syntaxen och fälten som används i den här meddelandefilen.
Exempelinformationsfil sample-info-file
Varje .info
-fil innehåller ett Files
- och Totals
-avsnitt. Avsnittet Files
innehåller en array som innehåller specifika mått för varje timfil. Avsnittet Totals
innehåller mätvärden som aggregerats över alla dina CDF-filer för en viss dag. Innehållet i .info
-filen kan se ut ungefär som i följande exempel.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Fält för informationsfil definierade info-file-fields-defined
I följande tabeller listas och definieras elementen i en CDF .info
-fil.
Filobjekt
Files
FileByteSize
FileChecksumMD5
ETag
är inte identisk med MD5-kontrollsumman för filen.FileName
FileSequenceNumber
Totalobjekt
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed gånger för filnamn och gånger för filinnehåll är olika different-processing-times
Filen CDF innehåller tidsstämplar i filnamnet och i filinnehållet. Dessa tidsstämplar registrerar olika händelseprocesser för samma CDF-fil. Det är inte ovanligt att olika tidsstämplar visas i namnet och innehållet i samma fil. Genom att förstå varje tidsstämpel kan du undvika vanliga misstag när du arbetar med dessa data eller försöker sortera dem efter tid.
Söker efter CDF filtidsstämplar locating-timestamps
CDF filer spelar in olika tid på två olika platser.
Förstå skillnaden mellan tidsstämplar understanding-timestamps
Följande tabell innehåller ytterligare information om tidsstämplar för din CDF-fil samt information om hur du använder dem på rätt sätt.
Tidsstämpeln i CDF-filnamnet anger den tid då Audience Manager började förbereda filen för leverans. Den här tidsstämpeln anges i tidszonen UTC. Parametern hour=
används, med tiden formaterad som en tvåsiffrig timme med 24 timmars notation. Den här tiden kan skilja sig från den händelsetid som spelas in i filinnehållet. När du arbetar med CDF filer kanske du märker att din S3-bucket är tom under en viss timme. En tom bucket betyder något av följande:
- Det finns inga data för just den timmen.
- Våra servrar är mycket belastade och kan inte bearbeta filer på en viss timme. När servern fångar upp placerar den de filer som borde ha gått in i en tidigare tidsmarkeringsfil i en hink med ett senare tidsvärde. Du kommer till exempel att se det här när en fil som borde ha varit inom timmen 17, visas inom timmen 18, (med
hour=18
i filnamnet). I det här fallet började servern förmodligen bearbeta filen på timme 17, men kunde inte slutföra den inom det tidsintervallet. I stället skickas filen till nästa timtidsintervall.
Viktigt: Använd inte filnamnets tidsstämpel för att gruppera händelser efter tid. Om du behöver gruppera efter tid använder du tidsstämpeln EventTime
i filinnehållet.
EventTime
, med tiden formaterad som yyyy-mm-dd hh:mm:ss
. Den här tiden ligger nära den faktiska tiden för händelsen på sidan, men den kan vara en annan än timindikatorn i filnamnet.Tips: Till skillnad från tidsstämpeln
hour=
i filnamnet kan du använda EventTime
för att gruppera data efter tid.