Customer Data Feeds customer-data-feeds

Grundläggande information om Customer Data Feed (CDF) och anvisningar om hur du kommer igång. Börja här om du är intresserad av att få CDF eller bara vill ha mer information.

Filinnehåll och syfte file-contents-purpose

En CDF-fil innehåller samma data som ett Audience Manager-händelseanrop (/event) skickar till våra servrar. Detta inkluderar data som användar-ID:n, trait IDs, segment IDsoch alla andra parametrar som har hämtats av ett händelseanrop. Intern Audience Manager systemen bearbetar händelsedata till CDF fil med innehåll ordnat i fält som visas i en angiven ordning. Audience Manager försöker generera CDF filer per timme och lagrar dem i en säker, kundspecifik bucket på en Amazon S3 server. Vi tillhandahåller dessa filer så att du kan arbeta med dem Audience Manager data utanför de gränser som våra användargränssnitt har.

IMPORTANT
Observera följande begränsningar när du arbetar med CDF-filer:
  • Innan du konfigurerar leveransen av CDF-filer bör du kontrollera att du har rätt behörighet från tredjepartsleverantörer för export av egenskaper från tredje part. Audience Manager stöder för närvarande inte funktioner i användargränssnittet för att begära exporttillstånd för CDF-filer från tredjepartsleverantörer av data, så kontakta dem oberoende av varandra.
  • Du ska inte använda CDF filer som en proxy för att övervaka sidtrafik, stämma av rapportavvikelser eller för fakturering osv.

Komma igång getting-started

Det finns ingen självbetjäningsprocess att starta CDF filleverans. Kontakta Audience Manager konsult eller kundtjänst för att komma igång. Under implementeringen kan du Audience Manager kommer att

  • Konfigurera Amazon S3 lagringsbucket.
  • Ange som skrivskyddad S3 autentiseringsuppgifter för din fillagringshastighet. Du kommer inte att kunna se eller komma åt kataloger och filer som tillhör andra kunder.

Filmeddelanden och CDF filerna visas i S3 när de är klara för nedladdning. Du ansvarar för att övervaka och hämta filer från dina tilldelade S3 katalog. Se Bearbetningsmeddelanden för CDF-filer.

Nästa steg next-steps

avsnitten nedan och Vanliga frågor om kunddataflöden kan hjälpa dig att bli mer bekant med den här tjänsten.

Customer Data Feed Innehåll som definierats cdf-defined

Listar och definierar dataelement och arrayer i en CDF fil, efter utseendeordning. Definitionerna innehåller datatyper, men den här informationen ingår inte i en CDF -fil.

IMPORTANT
Händelsepixlar exkluderas som standard i CDF-konfigurationer. Se till att du anger i din begäran till kundtjänst om du vill att händelsepixlar ska inkluderas i dina CDF-filer. Varje händelsepixel fylls i som en unik rad i dina CDF-filer.

Definitioner definitions

A CDF filen innehåller några eller alla fält som definieras nedan. Mer information om intern filordning finns i Filstruktur för kunddatafeed.

Fält
Datatyper
Beskrivning
Event Time
Tidsstämpel

Den tid en CDF-fil bearbetades av Datainsamlingsservrar (DCS). Tidsstämpeln använder yyyy-mm-dd hhss format och anges i UTC-tidszonen.

Obs! Händelsetiden är inte:

Device
Sträng
Det här är Unikt användar-ID (UUID), som är ett 38-siffrigt enhets-ID för besökaren på platsen. Se även Index för ID:n i Audience Manager.
Container ID
Numeriskt
ID:t för behållaren som aktiverar ID-synkronisering. Det här fältet fylls bara i om du anger behållar-ID i d_nsid -fält i webbplatsimplementeringen. I annat fall inkluderas inte standardvärdet 0 i CDF-filer.
Realized Traits
Numerisk array

En matris med trait ID:n som innehåller alla egenskaper som en besökare har realiserat (kvalificerat för) i händelseanropet.

Observera att arrayen kan innehålla egenskaper som besökaren har kvalificerat sig för tidigare och för vilka de kvalificerar sig igen genom det här händelseanropet.

Realized Segments
Numerisk array
En array med segment-ID:n som innehåller alla segment som en besökare realiserat (kvalificerat för) i händelseanropet.
Request Parameters
Sträng

En sträng som hämtar alla parametrar (variabler, ID:n, nyckelvärdepar, enhets-ID:n med mera) har skickats in i händelseanropet.

Kortare exempel:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
Sträng
Den okodade URL:en för den refererande sidan (om sådan finns).
IP Data Type
Sträng
IP-adressen för den besökare som fångats in i händelseanropet.
MCDevice
Sträng
The Experience Cloud ID (MID) som tilldelats besökaren. Se även Cookies och Adobe Experience Platform Identity Service.
All Segments
Numerisk array
En array med segment-ID:n som innehåller segment som redan realiserats och nya segment som besökaren är kvalificerad för.
All Traits
Numerisk array
En matris med första och tredje parts trait-ID:n som innehåller tidigare realiserade egenskaper och nya egenskaper som besökaren har kvalificerat sig för sedan den senaste datamatningen.

Customer Data Feed Filstruktur cdf-file-structure

Visar och definierar datastrukturen för en CDF -fil. Detta inkluderar datasekvens, fältavgränsare och avgränsare, datamappning och exempelfil.

Identifierare och sekvens för datafält identifiers-and-sequence

CDF filer innehåller inte taggade kolumner eller fältrubriker. I stället CDF filen definierar fält och arrayer med icke-utskrivbara ASCII tecken. Dessutom CDF -filen listar varje fält och array i en viss ordning. Genom att förstå fältidentifierarna och ordningen kan du tolka filen korrekt.

CDF-filelement
Beskrivning
Fältavgränsare och avgränsare

Dessa tecken som inte skrivs ut definierar elementen och strukturen i CDF-filen:

  • Ctrl + a (ASCII 001 eller ^A) separerar data i enskilda fält med en utrymmesindikator som inte skrivs ut.
  • Ctrl + b (ASCII 002 eller ^B) avgränsar data i en array och begär parametrar.
  • Ctrl + c (ASCII 003 eller ^C) definierar nyckelvärdepar.
Fältsekvens

Viktigt: Audience Manager förbehåller sig rätten att lägga till nya fält i slutet av CDF-filen i framtida versioner. Detta innebär att den tekniska utformningen av filtolkningssystemet inte ska anta ett fast antal kolumner (även om det kan anta en fast ordning för befintliga kolumner).

Data i CDF-filen visas i den ordning som visas nedan. /N kan visas i stället för något av dessa fält, vilket anger ett null-värde.

  1. Händelsetid
  2. Enhet
  3. Behållar-ID
  4. Realiserade egenskaper
  5. Realiserade segment
  6. Begärandeparametrar
  7. Referent
  8. IP-adress
  9. Experience Cloud enhets-ID (eller MID). Se även Cookies och Adobe Experience Platform Identity Service
  10. Alla segment
  11. Alla egenskaper

Fältbeskrivningar finns i Innehåll för kunddatafeed definierad.

CDF Filöversikt cdf-file-map

CDF fildata visas i den ordning som visas nedan.

Identifiera arrayer

Arrayer i en CDF filen börjar och slutar med Ctrl + a fältavgränsare. Detta gör att det första elementet i en array visas som ett fristående datafält. Den traits array börjar med ^A1234. Arrayavgränsaren och ID:t ^B5678 följer den här posten. Därför kan du vara frestad att tro att det första elementet i traits matrisen är ID 5678 (eftersom den börjar med ^B). Detta är inte fallet, och därför måste du känna till en datafils sekvens och struktur. Även om det första elementet i trait arrayen (eller någon annan array i en CDF fil) börjar med ^Adefinierar utseendeordningen eller placeringen i filen början av en array. Och det första elementet i en array separeras alltid från föregående post med ^A.

Exempel CDF Fil sample-file

Ett exempel CDF filen kan se ut ungefär så här. Vi har infogat radbrytningar i det här exemplet för att det ska passa in på sidan.

Customer Data Feed Namngivningskonventioner cdf-naming-conventions

Avsnitten nedan listar och definierar elementen i CDF filnamn.

CDF Filnamn: Syntax och exempel cdf-file-name

En typisk CDF filnamnet innehåller de element som anges nedan. Obs! kursiv anger en variabelplatshållare:

Syntax

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Exempel

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

I S3 lagringsintervall sorteras filerna i stigande ordning efter partner-ID (PID), dag och timme.

CDF Filnamnselement definierade cdf-file-name-elements

I följande tabell listas och definieras elementen i en CDF filnamn.

Filnamnselement
Beskrivning
s3://aam-cdf/
Det här är standardrotlagringskassetten för din CDF-fil på en Amazon S3-server.
your S3 bucket name
Namnet på den skrivskyddade S3-bucket som innehåller dina CDF-filer.
day=yyyy-mm-dd
Det datum då filen bearbetades.
hour=hh
Ett tidsvärde uttryckt i 24-timmarsnotation och angivet i UTC-tidszonen. Se även Filnamnstider för kunddatafeed och filinnehållstider...
partner ID
Ditt partner-ID.
File Sequence_0
Värden som identifierar filsekvensen. Sekvensen ökar enligt följande: 0_0_0, 0_1_0, 0_2_0....1_0_0
.gz
Ett GZIP-filtillägg. CDF-filer är gzip-komprimerade.

Customer Data Feed Filbearbetningsmeddelanden cdf-file-processing-notifications

Audience Manager skriver en .info till S3 för att ta reda på när Customer Data File (CDF) kan hämtas. The .info filen innehåller också JSON formaterade metadata om innehållet i CDF filer. I det här avsnittet finns information om syntaxen och fälten som används i den här meddelandefilen.

Exempelinformationsfil sample-info-file

Varje .info filen innehåller Files och Totals -avsnitt. The Files -avsnittet innehåller en array som innehåller specifika mått för varje timfil. The Totals -avsnittet innehåller mätvärden som är sammanställda över hela CDF filer för en viss dag. Innehållet i .info filen kan se ut ungefär som i följande exempel.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Fält för informationsfil definierade info-file-fields-defined

I följande tabeller listas och definieras elementen i en CDF .info -fil.

Filobjekt

Fält
Beskrivning
Files
Startar arrayen som innehåller metadata om dina CDF-filer.
FileByteSize
Filstorlek i byte.
FileChecksumMD5
Amazon S3 ETag. Siffran efter bindestrecket visar antalet delar som används för att skapa filen under överföringen av flera delar. The ETag är inte identisk med filens MD5-kontrollsumma.
FileName
Filnamnet. Se Namnkonventioner för kunddataflödesfiler.
FileSequenceNumber
Ett indexvärde för varje fil.

Summobjekt

Fält
Beskrivning
Totals
Startar objektet som innehåller aggregerade data om alla dina CDF-filer.
Day
Den dag som informationen är tillgänglig. Användningsområden yyyy-mm-dd format.
Hour
Timmen som data är tillgängliga för. Använder 24-timmarsformat som angetts i UTC-tidszon.
TotalByteSize
Den totala storleken för alla dina CDF-filer för det datumet i byte.
TotalNumberFiles
Totalt antal filer som överförts till din S3-katalog.

Customer Data Feed Filnamnstiderna och filinnehållstiderna skiljer sig åt different-processing-times

Dina CDF filen innehåller tidsstämplar i filnamnet och filinnehållet. Dessa tidsstämplar registrerar olika händelseprocesser för samma CDF -fil. Det är inte ovanligt att olika tidsstämplar visas i namnet och innehållet i samma fil. Genom att förstå varje tidsstämpel kan du undvika vanliga misstag när du arbetar med dessa data eller försöker sortera dem efter tid.

Hitta CDF Tidsstämplar locating-timestamps

CDF filer spelar in olika tid på två olika platser.

Förstå skillnaden mellan tidsstämplar understanding-timestamps

I följande tabell finns mer information om CDF tidsstämplar och information om hur de används.

Tidsstämpelplats
Beskrivning
Filnamn

Tidsstämpeln i CDF filnamnet anger när Audience Manager började förbereda filen för leverans. Den här tidsstämpeln anges i UTC tidszon. Den använder hour= parameter, med tiden formaterad som en tvåsiffrig timme med 24 timmars notation. Den här tiden kan skilja sig från den händelsetid som spelas in i filinnehållet. När du arbetar med CDF filer, ibland märker du att S3 Bucket är tomt under en viss timme. En tom bucket betyder något av följande:

  • Det finns inga data för just den timmen.
  • Våra servrar är mycket belastade och kan inte bearbeta filer på en viss timme. När servern fångar upp placerar den de filer som borde ha gått in i en tidigare tidsmarkeringsfil i en hink med ett senare tidsvärde. Du kommer till exempel att se det här när en fil som borde ha varit inom timmen 17, visas inom timmen 18, (med hour=18 i filnamnet). I det här fallet började servern förmodligen bearbeta filen på timme 17, men kunde inte slutföra den inom det tidsintervallet. I stället skickas filen till nästa timtidsintervall.

Viktigt: Använd inte filnamnets tidsstämpel för att gruppera händelser efter tid. Om du behöver gruppera efter tid använder du EventTime tidsstämpel i filinnehållet.

Filinnehåll
Tidsstämpeln i CDF filinnehållet markerar när Data Collection Servers började bearbeta filen. Den här tidsstämpeln anges i UTC tidszon. Den använder EventTime fält, med tid formaterad som yyyy-mm-dd hh:mm:ss. Den här tiden ligger nära den faktiska tiden för händelsen på sidan, men kan vara en annan än timindikatorn i filnamnet.
Tips: Till skillnad från hour= tidsstämpel i filnamnet kan du använda EventTime för att gruppera data efter tid.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695