Customer Data Feeds customer-data-feeds

Basisinformatie over Customer Data Feed (CDF) en instructies over hoe u aan de slag kunt gaan. Begin hier als je interesse hebt in CDF of meer informatie.

Bestandsinhoud en doel file-contents-purpose

Een CDF-bestand bevat dezelfde data die een Audience Manager-gebeurteniscall (/event) naar onze servers verzendt. Dit omvat gegevens zoals gebruikers-id's, trait IDs, segment IDsen alle andere parameters die door een gebeurtenisaanroep worden vastgelegd. Intern Audience Manager systemen verwerken gebeurtenisgegevens in een CDF bestand met inhoud die is ingedeeld in velden die in een ingestelde volgorde worden weergegeven. Audience Manager pogingen om te genereren CDF bestanden per uur worden opgeslagen en opgeslagen in een beveiligd, klantspecifiek emmertje op een Amazon S3 server. We bieden deze bestanden zodat u kunt werken met Audience Manager gegevens buiten de grenzen die door onze gebruikersinterface worden opgelegd.

IMPORTANT
Houd rekening met de volgende beperkingen wanneer u werkt met CDF-bestanden:
  • Voordat u CDF-bestandslevering instelt, moet u ervoor zorgen dat u over de juiste machtigingen van externe gegevensleveranciers beschikt voor het exporteren van externe traits. Audience Manager ondersteunt momenteel geen functionaliteit in de gebruikersinterface om CDF-toestemming voor het exporteren van bestanden van gegevensleveranciers van derden te vragen. Neem daarom een onafhankelijk contact op met deze leveranciers.
  • U mag het niet gebruiken CDF bestanden als een proxy om het paginaverkeer te controleren, discrepanties tussen rapporten of facturering op elkaar af te stemmen, enz.

Aan de slag getting-started

Er is geen zelfbedieningsproces om te beginnen CDF bestandslevering. Neem contact op met uw Audience Manager consultant of klantenservice om aan de slag te gaan. Tijdens de implementatie Audience Manager vertegenwoordiger:

  • Stel uw Amazon S3 opslagemmer.
  • Alleen-lezen opgeven S3 verificatiereferenties naar het opslagemmertje voor bestanden. U kunt geen mappen en bestanden zien of openen die bij andere klanten horen.

Bestandsmeldingen en CDF bestanden worden weergegeven in uw S3 emmertje als ze klaar zijn om te downloaden. U bent verantwoordelijk voor het controleren en downloaden van bestanden van uw toegewezen S3 directory. Zie Voortgangsmeldingen voor klantdatafeedbestanden.

Volgende stappen next-steps

De onderstaande secties en de Veelgestelde vragen over de gegevensfeed van de klant kan u helpen vertrouwd met deze dienst worden.

Customer Data Feed Gedefinieerde inhoud cdf-defined

Hiermee worden de gegevenselementen en arrays in een CDF bestand, op volgorde van weergave. Definities omvatten gegevenstypen, maar deze informatie maakt geen deel uit van een CDF bestand.

IMPORTANT
Gebeurtenispixels worden standaard uitgesloten in CDF-configuraties. Zorg ervoor dat u in uw verzoek aan de klantenzorg specificeert als u gebeurtenispixel om in uw CDF- dossiers wilt worden omvat. Elke gebeurtenispixel wordt als een unieke rij in uw CDF-bestanden gevuld.

Definities definitions

A CDF bevat enkele of alle velden die hieronder worden gedefinieerd. Voor informatie over interne bestandsorganisatie raadpleegt u Bestandsstructuur voor klantgegevens.

Veld
Datatype
Beschrijving
Event Time
Tijdstempel

De tijd dat een CDF-bestand is verwerkt door de Gegevensverzamelingsservers (DCS). De tijdstempel gebruikt de jjjj-mm-dd hhss en wordt ingesteld in de tijdzone UTC.

Opmerking: De tijd van de gebeurtenis is niet:

Device
String
Dit is het Unieke gebruikersnaam (UUID). Dit is een apparaat-id van 38 cijfers voor uw sitebezoeker. Zie ook: Index van id's in Audience Manager.
Container ID
Numeriek
De id van de container die de syncs van id's activeert. Dit veld wordt alleen gevuld als u de container-id instelt in het dialoogvenster d_nsid in uw site-implementatie. Anders wordt de standaardwaarde 0 niet opgenomen in CDF-bestanden.
Realized Traits
Numerieke array

Een array met referentie-id's die alle kenmerken bevat die een bezoeker heeft gerealiseerd (gekwalificeerd voor) in de gebeurtenisaanroep.

De array kan kenmerken bevatten waarvoor de bezoeker eerder had gekwalificeerd en waarvoor ze via deze gebeurtenisaanroep opnieuw in aanmerking kwamen.

Realized Segments
Numerieke array
Een array van segment-id's die alle segmenten bevat die een bezoeker heeft gerealiseerd (gekwalificeerd voor) in de gebeurtenisaanroep.
Request Parameters
String

Een tekenreeks die alle parameters vastlegt (variabelen, id's, sleutelwaardeparen, id's voor apparaatreclame, enz.) overgegaan binnen de gebeurtenisvraag.

Verkort voorbeeld:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
String
De niet-gecodeerde URL van de verwijzende pagina (indien aanwezig).
IP Data Type
String
Het IP-adres van de bezoeker die is vastgelegd in de gebeurtenisaanroep.
MCDevice
String
De Experience Cloud Id (MID) die is toegewezen aan de sitebezoeker. Zie ook: Cookies en de Adobe Experience Platform Identity Service.
All Segments
Numerieke array
Een array van segment-id's die eerder gerealiseerde segmenten en nieuwe segmenten bevat waarvoor de bezoeker in aanmerking komt.
All Traits
Numerieke array
Een array met ID's van het eerste en het derde kenmerk die eerder gerealiseerde kenmerken en nieuwe kenmerken bevat waarvoor de bezoeker zich heeft gekwalificeerd sinds de laatste gegenereerde gegevensfeed.

Customer Data Feed Bestandsstructuur cdf-file-structure

Hiermee geeft u de gegevensstructuur van een CDF bestand. Dit omvat gegevensreeksen, gebiedsscheidingen en scheidingstekens, een kaart van het gegevensdossier, en steekproefdossier.

Id's en volgorde van gegevensvelden identifiers-and-sequence

CDF bestanden bevatten geen gelabelde kolommen of veldkoppen. In plaats daarvan CDF bestand definieert velden en arrays met niet-afdrukbare ASCII tekens. Ook de CDF elk veld en elke array wordt in een bepaalde volgorde weergegeven. Als u de veld-id's en de volgorde begrijpt, kunt u het bestand op de juiste wijze parseren.

CDF-bestandselement
Beschrijving
Veldscheidingstekens en scheidingstekens

Deze niet-afdrukbare tekens definiëren de elementen en structuur van het CDF-bestand:

  • Ctrl + a (ASCII) 001 of ^A) worden gegevens in afzonderlijke velden gescheiden met een niet-afdrukbare ruimte-indicator.
  • Ctrl + b (ASCII) 002 of ^B) scheidt gegevens en array- en request-parameters.
  • Ctrl + c (ASCII) 003 of ^C) definieert sleutelwaardeparen.
Veldvolgorde

Belangrijk: Audience Manager behoudt zich het recht voor om nieuwe velden toe te voegen aan het einde van het CDF-bestand in toekomstige versies. Dit betekent het technische ontwerp van uw dossier het ontleden systeem niet een vast aantal kolommen zou moeten veronderstellen (hoewel het een vaste orde voor bestaande kolommen kan veronderstellen).

De gegevens in uw CDF-bestand worden weergegeven in de onderstaande volgorde. /N kan in plaats van om het even welk van deze gebieden verschijnen, wijzend op een ongeldige waarde.

  1. Gebeurtenistijd
  2. Apparaat
  3. Container-id
  4. Realistische kenmerken
  5. Geregistreerde segmenten
  6. Parameters aanvragen
  7. Verwijzing
  8. IP-adres
  9. Experience Cloud Device ID (of MID). Zie ook: Cookies en de Adobe Experience Platform Identity Service
  10. Alle segmenten
  11. Alle sporen

Zie voor veldbeschrijvingen Inhoud van feed-gegevens van klant gedefinieerd.

CDF Bestandstoewijzing cdf-file-map

CDF bestandsgegevens worden weergegeven in de volgorde hieronder.

Arrays identificeren

Arrays in een CDF het dossier begint en beëindigt met Ctrl + a veldscheidingsteken. Hierdoor lijkt het eerste element in een array op een zelfstandig gegevensveld. De gerealiseerde traits array begint met ^A1234. Arrayscheidingsteken en id ^B5678 volgt deze vermelding. Als gevolg hiervan zou u geneigd kunnen zijn te denken dat het eerste element in gerealiseerde traits array is ID 5678 (omdat deze begint met ^B). Dit is niet het geval, en daarom moet u met de opeenvolging en de structuur van een gegevensdossier vertrouwd zijn. Hoewel het eerste element in de trait array (of een van de andere arrays in een CDF bestand) begint met ^ADe volgorde van weergave of positie in het bestand definieert het begin van een array. En het eerste element in een array wordt altijd gescheiden van het vorige item door ^A.

Monster CDF Bestand sample-file

Een monster CDF kan er als volgt uitzien. In dit voorbeeld zijn regeleinden ingevoegd om deze aan te passen aan de pagina.

Customer Data Feed Naamgevingsconventies voor bestanden cdf-naming-conventions

In de onderstaande secties worden de elementen in uw CDF bestandsnaam.

CDF Bestandsnaam: Syntaxis en voorbeeld cdf-file-name

Een standaard CDF de bestandsnaam bevat de onderstaande elementen. Opmerking: cursief Hiermee wordt een tijdelijke aanduiding voor een variabele aangegeven:

Syntaxis

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Voorbeeld

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

In uw S3 opslagemmer, de dossiers worden gesorteerd in stijgende orde door identiteitskaart van de Partner (PID), dag en uur.

CDF Bestandsnaamelementen gedefinieerd cdf-file-name-elements

In de volgende tabel worden de elementen in een CDF bestandsnaam.

Bestandsnaamelement
Beschrijving
s3://aam-cdf/
Dit is het standaard, basisopslagemmertje voor uw CDF-bestand op een Amazon S3-server.
your S3 bucket name
De naam van het read-only, S3 emmertje dat uw CDF dossiers houdt.
day=yyyy-mm-dd
De datum waarop het bestand is verwerkt.
hour=hh
Een tijdwaarde uitgedrukt in notatie van 24 uur en ingesteld in de tijdzone UTC. Zie ook: Tijdstippen en tijden van bestandsinhoud voor klantgegevens.
partner ID
Je partner-id.
File Sequence_0
Waarden die de bestandsreeks identificeren. De reeks wordt als volgt verhoogd: 0_0_0, 0_1_0, 0_2_0....1_0_0
.gz
Een gzip-bestandsextensie. CDF-bestanden worden gecomprimeerd met gzip.

Customer Data Feed Meldingen voor bestandsverwerking cdf-file-processing-notifications

Audience Manager schrijft een .info bestand naar uw S3 directory om u te laten weten wanneer uw Customer Data File (CDF) is klaar om te worden gedownload. De .info bestand bevat ook JSON opgemaakte metagegevens over de inhoud van uw CDF bestanden. Controleer deze sectie voor informatie over de syntaxis en de gebieden die door dit berichtdossier worden gebruikt.

Voorbeeldgegevensbestand sample-info-file

Elk .info bestand bevat een Files en Totals sectie. De Files -sectie bevat een array die specifieke meetgegevens bevat voor elk uurbestand. De Totals sectie bevat cijfers die zijn geaggregeerd voor al uw CDF bestanden voor een bepaalde dag. De inhoud van uw .info kan er ongeveer als volgt uitzien.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Gedefinieerde gegevensbestandsvelden info-file-fields-defined

In de volgende tabellen worden de elementen in een CDF .info bestand.

Bestandsobject

Veld
Beschrijving
Files
Start de array die metagegevens over uw CDF-bestanden bevat.
FileByteSize
Bestandsgrootte in bytes.
FileChecksumMD5
De Amazon S3 ETag. Het nummer na het koppelteken geeft het aantal onderdelen weer dat wordt gebruikt om het bestand te maken tijdens het uploaden van meerdere onderdelen. De ETag is niet gelijk aan de MD5-controlesom van het bestand.
FileName
De bestandsnaam. Zie Naamgevingsconventies voor bestanden met namen van klantgegevens.
FileSequenceNumber
Een indexnummer voor elk bestand.

Totalen, object

Veld
Beschrijving
Totals
Start het object dat samengevoegde gegevens over al uw CDF-bestanden bevat.
Day
De dag waarvoor de gegevens beschikbaar zijn. Gebruiksmiddelen jjjj-mm-dd gebruiken.
Hour
Het uur waarvoor gegevens beschikbaar zijn. Gebruikt een 24-uursnotatie in UTC-tijdzone.
TotalByteSize
De totale grootte van al uw CDF-bestanden voor die datum in bytes.
TotalNumberFiles
Het totale aantal bestanden dat naar uw S3-map is geüpload.

Customer Data Feed Tijdstippen voor bestandsnaam en bestandsinhoud verschillen different-processing-times

Uw CDF bevat tijdstempels in de bestandsnaam en de bestandsinhoud. Deze tijdstempels registreren verschillende gebeurtenisprocessen voor hetzelfde CDF bestand. Het is niet ongebruikelijk om verschillende tijdstempels in de naam en inhoud van het zelfde dossier te zien. Als u een goed begrip van elk tijdstempel hebt, voorkomt u vaak voorkomende fouten wanneer u met deze gegevens werkt of probeert deze op tijd te sorteren.

Locatie CDF Tijdstempels voor bestand locating-timestamps

CDF in bestanden wordt de tijd op twee verschillende locaties vastgelegd.

Het verschil tussen tijdstempels begrijpen understanding-timestamps

De volgende tabel bevat aanvullende informatie over uw CDF bestandstijdstempels samen met informatie over het juiste gebruik ervan.

Locatie tijdstempel
Beschrijving
Bestandsnaam

Het tijdstempel in uw CDF bestandsnaam markeert de tijd waarop Audience Manager begon uw bestand voor levering voor te bereiden. Deze tijdstempel wordt ingesteld in het dialoogvenster UTC tijdzone. Het gebruikt de hour= parameter, met tijd die als 2-cijferig uur in 24-uursnotatie wordt geformatteerd. Deze tijd kan anders zijn dan de tijd van de gebeurtenis die in de bestandsinhoud is opgenomen. Wanneer u werkt met CDF soms zult u merken dat uw S3 emmertje is een bepaald uur leeg. Onder "lege emmer" wordt verstaan:

  • Er zijn geen gegevens voor dat specifieke uur.
  • Onze servers zijn zwaar belast en kunnen geen dossiers voor een bepaald uur verwerken. Wanneer de server omhoog vangt, zet het de dossiers die in een vroegere dossiers van het tijdemmertje in een emmer met een recentere tijdwaarde zouden moeten zijn gegaan. Bijvoorbeeld, zult u dit zien wanneer een dossier dat in het uur 17 emmertje zou moeten geweest in het uur 18 emmer verschijnen (met hour=18 in de bestandsnaam). In dit geval is de server waarschijnlijk begonnen met het verwerken van uw bestand in uur 17, maar kon het bestand niet binnen dat tijdsinterval voltooien. In plaats daarvan wordt het bestand naar het volgende uurtje geduwd.

Belangrijk: Gebruik geen tijdstempel voor de bestandsnaam om gebeurtenissen te groeperen. Als u wilt groeperen in tijd, gebruikt u EventTime tijdstempel in de bestandsinhoud.

Bestandsinhoud
Het tijdstempel in uw CDF bestandsinhoud geeft de tijd aan Data Collection Servers is begonnen met het verwerken van het bestand. Deze tijdstempel wordt ingesteld in het dialoogvenster UTC tijdzone. Het gebruikt de EventTime veld, met tijd opgemaakt als yyyy-mm-dd hh:mm:ss. Deze tijd ligt dicht bij de werkelijke tijd van de gebeurtenis op de pagina, maar kan verschillen van de tijdindicator in de bestandsnaam.
Tip: In tegenstelling tot hour= tijdstempel in de bestandsnaam, kunt u EventTime om gegevens op tijd te groeperen.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695