Customer Data Feeds customer-data-feeds

Grundläggande information om Customer Data Feed (CDF) filer och anvisningar om hur du kommer igång. Börja här om du vill få CDF filer eller bara vill ha mer information.

Filinnehåll och syfte file-contents-purpose

En CDF-fil innehåller samma data som ett Audience Manager händelseanrop (/event) skickar till våra servrar. Detta inkluderar data som användar-ID:n, trait IDs, segment IDs och alla andra parametrar som fångats in av ett händelseanrop. Interna Audience Manager-system bearbetar händelsedata till en CDF-fil med innehåll organiserat i fält som visas i en angiven ordning. Audience Manager försöker generera CDF filer per timme och lagrar dem i en säker, kundspecifik bucket på en Amazon S3-server. Vi tillhandahåller dessa filer så att du kan arbeta med Audience Manager-data utanför de gränser som gäller för användargränssnittet.

IMPORTANT
Observera följande begränsningar när du arbetar med CDF-filer:
  • Innan du konfigurerar leveransen av CDF-filer bör du kontrollera att du har rätt behörighet från tredjepartsleverantörer för export av egenskaper från tredje part. Audience Manager stöder för närvarande inte funktioner i användargränssnittet för att begära exporttillstånd för CDF-filer från tredjepartsleverantörer av data, så kontakta dem oberoende av varandra.
  • Du bör inte använda CDF-filer som proxy för att övervaka sidtrafik, avstämning av rapportavvikelser eller för fakturering osv.

Komma igång getting-started

Det finns ingen självbetjäningsprocess för att starta leveransen av filen CDF. Kontakta din Audience Manager-konsult eller kundtjänst för att komma igång. Under implementeringen kommer din Audience Manager-representant att:

  • Konfigurera din Amazon S3-lagringsbucket.
  • Ange skrivskyddade autentiseringsuppgifter för S3 till din fillagringsbucket. Du kommer inte att kunna se eller komma åt kataloger och filer som tillhör andra kunder.

Filmeddelanden och CDF filer visas i din S3-bucket när de är klara för hämtning. Du ansvarar för att övervaka och hämta filer från din tilldelade S3-katalog. Se Bearbetningsmeddelanden för CDF-filer.

Nästa steg next-steps

Avsnitten nedan och Vanliga frågor om kunddataflöden kan hjälpa dig att bli mer bekant med den här tjänsten.

Customer Data Feed innehåll har definierats cdf-defined

Visar och definierar dataelement och arrayer i en CDF-fil, efter utseendeordning. Definitioner innehåller datatyper, men den här informationen ingår inte i en CDF-fil.

IMPORTANT
Händelsepixlar exkluderas som standard i CDF-konfigurationer. Se till att du anger i din begäran till kundtjänst om du vill att händelsepixlar ska inkluderas i dina CDF-filer. Varje händelsepixel fylls i som en unik rad i dina CDF-filer.

Definitioner definitions

En CDF-fil innehåller några eller alla fält som definieras nedan. Mer information om intern filordning finns i Filstruktur för kunddatafeed.

Fält
Datatyper
Beskrivning
Event Time
Tidsstämpel

Den tid en CDF-fil bearbetades av DCS-servrarna (Data Collection Servers). Tidsstämpeln använder formatet åååå-mm-dd hhss och anges i UTC-tidszonen.

Obs! Händelsetiden är inte:

Device
Sträng
Detta är det unika användar-ID:t (UUID), som är ett 38-siffrigt enhets-ID för besökaren på platsen. Se även -index för ID:n i Audience Manager.
Container ID
Numeriskt
ID:t för behållaren som aktiverar ID-synkronisering. Det här fältet fylls bara i om du anger behållar-ID i fältet d_nsid i webbplatsimplementeringen. I annat fall inkluderas inte standardvärdet 0 i CDF-filer.
Realized Traits
Numerisk array

En matris med trait ID:n som innehåller alla egenskaper som en besökare har realiserat (kvalificerat för) i händelseanropet.

Observera att arrayen kan innehålla egenskaper som besökaren har kvalificerat sig för tidigare och för vilka de kvalificerar sig igen genom det här händelseanropet.

Realized Segments
Numerisk array
En array med segment-ID:n som innehåller alla segment som en besökare realiserat (kvalificerat för) i händelseanropet.
Request Parameters
Sträng

En sträng som hämtar alla parametrar (variabler, ID:n, nyckelvärdepar, enhets-ID:n med mera) har skickats in i händelseanropet.

Kortare exempel:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
Sträng
Den okodade URL:en för den refererande sidan (om sådan finns).
IP Data Type
Sträng
IP-adressen för den besökare som fångats in i händelseanropet.
MCDevice
Sträng
Experience Cloud-ID (MID) som tilldelats webbplatsbesökaren. Se även Cookies och Adobe Experience Platform Identity Service.
All Segments
Numerisk array
En array med segment-ID:n som innehåller segment som redan realiserats och nya segment som besökaren är kvalificerad för.
All Traits
Numerisk array
En matris med första och tredje parts trait-ID:n som innehåller tidigare realiserade egenskaper och nya egenskaper som besökaren har kvalificerat sig för sedan den senaste datamatningen.

Customer Data Feed Filstruktur cdf-file-structure

Visar och definierar datastrukturen för en CDF-fil. Detta inkluderar datasekvens, fältavgränsare och avgränsare, datamappning och exempelfil.

Identifierare och sekvens för datafält identifiers-and-sequence

CDF filer innehåller inte taggade kolumner eller fältrubriker. I stället definierar en CDF-fil fält och arrayer med ASCII tecken som inte skrivs ut. Dessutom visar filen CDF varje fält och matris i en viss ordning. Genom att förstå fältidentifierarna och ordningen kan du tolka filen korrekt.

CDF-filelement
Beskrivning
Fältavgränsare och avgränsare

Dessa tecken som inte skrivs ut definierar elementen och strukturen i CDF-filen:

  • Ctrl + a (ASCII 001 eller ^A) separerar data i enskilda fält med en utrymmesindikator som inte skrivs ut.
  • Ctrl + b (ASCII 002 eller ^B) separerar data från en array och begär parametrar.
  • Ctrl + c (ASCII 003 eller ^C) definierar nyckelvärdepar.
Fältsekvens

Viktigt: Audience Manager förbehåller sig rätten att lägga till nya fält i slutet av CDF-filen i framtida versioner. Detta innebär att den tekniska utformningen av filtolkningssystemet inte ska anta ett fast antal kolumner (även om det kan anta en fast ordning för befintliga kolumner).

Data i CDF-filen visas i den ordning som visas nedan. /N kan visas i stället för något av dessa fält, vilket anger ett null-värde.

  1. Händelsetid
  2. Enhet
  3. Behållar-ID
  4. Realiserade egenskaper
  5. Realiserade segment
  6. Begärandeparametrar
  7. Referent
  8. IP-adress
  9. Experience Cloud enhets-ID (eller MID). Se även cookies och Adobe Experience Platform identitetstjänst
  10. Alla segment
  11. Alla egenskaper

Fältbeskrivningar finns i Innehåll för kunddatafeed definierad.

CDF filöversikt cdf-file-map

CDF fildata visas i den ordning som visas nedan.

Identifiera arrayer

Matriser i en CDF-fil börjar och slutar med fältavgränsaren Ctrl + a. Detta gör att det första elementet i en array visas som ett fristående datafält. Den realiserade traits-matrisen börjar till exempel med ^A1234. Matrisavgränsaren och ID ^B5678 följer efter den här posten. Det kan därför vara frestande att tro att det första elementet i den realiserade traits-arrayen är ID 5678 (eftersom den börjar med ^B). Detta är inte fallet, och därför måste du känna till en datafils sekvens och struktur. Även om det första elementet i den realiserade trait-arrayen (eller någon av de andra arrayerna i en CDF -fil) börjar med ^A, definierar utseendeordningen eller positionen i filen början av en array. Och det första elementet i en array separeras alltid från föregående post med ^A.

Exempel på CDF-fil sample-file

Ett exempel på en CDF-fil kan se ut ungefär så här. Vi har infogat radbrytningar i det här exemplet för att det ska passa in på sidan.

Customer Data Feed konventioner för namngivning av filer cdf-naming-conventions

Avsnitten nedan listar och definierar elementen i ditt CDF-filnamn.

CDF filnamn: Syntax och exempel cdf-file-name

Ett typiskt CDF-filnamn innehåller elementen som listas nedan. Obs! italics anger en variabelplatshållare:

Syntax

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Exempel

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

I din S3-lagringsbucket sorteras filerna i stigande ordning efter partner-ID (PID), dag och timme.

CDF filnamnselement har definierats cdf-file-name-elements

I följande tabell visas och definieras elementen i ett CDF-filnamn.

Filnamnselement
Beskrivning
s3://aam-cdf/
Det här är standardrotlagringskassetten för din CDF-fil på en Amazon S3-server.
your S3 bucket name
Namnet på den skrivskyddade S3-bucket som innehåller dina CDF-filer.
day=yyyy-mm-dd
Det datum då filen bearbetades.
hour=hh
Ett tidsvärde uttryckt i 24-timmarsnotation och angivet i UTC-tidszonen. Se även Filnamnstider för kunddatafeed och Filinnehållstider....
partner ID
Ditt partner-ID.
File Sequence_0
Värden som identifierar filsekvensen. Sekvensen ökar enligt följande: 0_0_0 , 0_1_0, 0_2_0...1_0_0
.gz
Ett GZIP-filtillägg. CDF-filer är gzip-komprimerade.

Customer Data Feed meddelanden om filbearbetning cdf-file-processing-notifications

Audience Manager skriver en .info-fil till din S3-katalog för att tala om när Customer Data File (CDF) är klar för hämtning. Filen .info innehåller även JSON formaterade metadata om innehållet i dina CDF-filer. I det här avsnittet finns information om syntaxen och fälten som används i den här meddelandefilen.

Exempelinformationsfil sample-info-file

Varje .info-fil innehåller ett Files- och Totals-avsnitt. Avsnittet Files innehåller en array som innehåller specifika mått för varje timfil. Avsnittet Totals innehåller mätvärden som aggregerats över alla dina CDF-filer för en viss dag. Innehållet i .info-filen kan se ut ungefär som i följande exempel.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Fält för informationsfil definierade info-file-fields-defined

I följande tabeller listas och definieras elementen i en CDF .info -fil.

Filobjekt

Fält
Beskrivning
Files
Startar arrayen som innehåller metadata om dina CDF-filer.
FileByteSize
Filstorlek i byte.
FileChecksumMD5
Amazon S3 ETag. Siffran efter bindestrecket visar antalet delar som används för att skapa filen under överföringen av flera delar. ETag är inte identisk med MD5-kontrollsumman för filen.
FileName
Filnamnet. Se konventioner om namngivning av kunddataflödesfiler.
FileSequenceNumber
Ett indexvärde för varje fil.

Totalobjekt

Fält
Beskrivning
Totals
Startar objektet som innehåller aggregerade data om alla dina CDF-filer.
Day
Den dag som informationen är tillgänglig. Använder formatet åååå-mm-dd.
Hour
Timmen som data är tillgängliga för. Använder 24-timmarsformat som angetts i UTC-tidszon.
TotalByteSize
Den totala storleken för alla dina CDF-filer för det datumet i byte.
TotalNumberFiles
Totalt antal filer som överförts till din S3-katalog.

Customer Data Feed gånger för filnamn och gånger för filinnehåll är olika different-processing-times

Filen CDF innehåller tidsstämplar i filnamnet och i filinnehållet. Dessa tidsstämplar registrerar olika händelseprocesser för samma CDF-fil. Det är inte ovanligt att olika tidsstämplar visas i namnet och innehållet i samma fil. Genom att förstå varje tidsstämpel kan du undvika vanliga misstag när du arbetar med dessa data eller försöker sortera dem efter tid.

Söker efter CDF filtidsstämplar locating-timestamps

CDF filer spelar in olika tid på två olika platser.

Förstå skillnaden mellan tidsstämplar understanding-timestamps

Följande tabell innehåller ytterligare information om tidsstämplar för din CDF-fil samt information om hur du använder dem på rätt sätt.

Tidsstämpelplats
Beskrivning
Filnamn

Tidsstämpeln i CDF-filnamnet anger den tid då Audience Manager började förbereda filen för leverans. Den här tidsstämpeln anges i tidszonen UTC. Parametern hour= används, med tiden formaterad som en tvåsiffrig timme med 24 timmars notation. Den här tiden kan skilja sig från den händelsetid som spelas in i filinnehållet. När du arbetar med CDF filer kanske du märker att din S3-bucket är tom under en viss timme. En tom bucket betyder något av följande:

  • Det finns inga data för just den timmen.
  • Våra servrar är mycket belastade och kan inte bearbeta filer på en viss timme. När servern fångar upp placerar den de filer som borde ha gått in i en tidigare tidsmarkeringsfil i en hink med ett senare tidsvärde. Du kommer till exempel att se det här när en fil som borde ha varit inom timmen 17, visas inom timmen 18, (med hour=18 i filnamnet). I det här fallet började servern förmodligen bearbeta filen på timme 17, men kunde inte slutföra den inom det tidsintervallet. I stället skickas filen till nästa timtidsintervall.

Viktigt: Använd inte filnamnets tidsstämpel för att gruppera händelser efter tid. Om du behöver gruppera efter tid använder du tidsstämpeln EventTime i filinnehållet.

Filinnehåll
Tidsstämpeln i CDF-filens innehåll markerar den tidpunkt då Data Collection Servers började bearbeta filen. Den här tidsstämpeln anges i tidszonen UTC. Det använder fältet EventTime, med tiden formaterad som yyyy-mm-dd hh:mm:ss. Den här tiden ligger nära den faktiska tiden för händelsen på sidan, men den kan vara en annan än timindikatorn i filnamnet.
Tips: Till skillnad från tidsstämpeln hour= i filnamnet kan du använda EventTime för att gruppera data efter tid.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695