Informazioni di base sui file Customer Data Feed (CDF) e istruzioni su come iniziare. Iniziate da qui se siete interessati a ricevere CDF file o volete solo ulteriori informazioni.
Un file CDF contiene gli stessi dati che una chiamata evento di Audience Manager (/event
) invia ai nostri server. Ciò include dati come ID utente, trait IDs, segment IDs e tutti gli altri parametri acquisiti da una chiamata evento. I sistemi Audience Manager interni elaborano i dati evento in un file CDF con il contenuto organizzato in campi che vengono visualizzati in un ordine impostato. Audience Manager tenta di generare CDF i file ogni ora e li memorizza in un bucket sicuro e specifico per il cliente su un Amazon S3 server. Forniamo questi file in modo che possiate lavorare con i dati Audience Manager al di fuori dei limiti imposti dalla nostra interfaccia utente.
Tenete presenti le seguenti limitazioni quando lavorate con i file CDF:
Non è disponibile alcun processo self-service per avviare la consegna dei file CDF. Contatta il tuo Audience Manager consulente o l'Assistenza clienti per iniziare. Durante l'implementazione, il tuo Audience Manager rappresentante:
Le notifiche dei file e i file CDF verranno visualizzati nel bucket S3 quando sono pronti per il download. Sei responsabile del monitoraggio e del download dei file dalla directory S3 assegnata. Consulta Customer Data Feed File Processing Notifications.
Le sezioni seguenti e le Domande frequenti sui feed di dati cliente possono aiutarti a familiarizzare con questo servizio.
Elenca e definisce gli elementi e gli array di dati in un file CDF, in base all'ordine di aspetto. Le definizioni includono i tipi di dati, ma queste informazioni non fanno parte di un file CDF.
Un file CDF include alcuni o tutti i campi definiti di seguito. Per informazioni sull'organizzazione interna dei file, vedere Struttura dei file dei feed di dati cliente.
Campo | Tipo di dati | Descrizione |
---|---|---|
|
Timestamp |
L'ora in cui un file CDF è stato elaborato da Data Collection Servers (DCS). Il timestamp utilizza il formato yyyy-mm-dd hh:mm:ss ed è impostato nel fuso orario UTC.
Nota: L'ora evento non è:
|
|
Stringa |
Si tratta dell' ID utente univoco (UUID), un ID dispositivo di 38 cifre per il visitatore del sito. Vedi anche Indice degli ID in Audience Manager. |
|
Numeriche |
ID del contenitore che attiva la sincronizzazione ID. |
|
Matrice numerica |
Un array di ID caratteristica che contiene tutte le caratteristiche realizzate (qualificate) da un visitatore nella chiamata all’evento. L’array può contenere caratteristiche per le quali il visitatore ha già acquisito i requisiti necessari e per le quali è stato riqualificato tramite questa chiamata all’evento. |
|
Matrice numerica |
Un array di ID di segmento che contiene tutti i segmenti realizzati (qualificati) da un visitatore nella chiamata all’evento. |
|
Stringa |
Una stringa che acquisisce tutti i parametri (variabili, ID, coppie chiave-valore, ID pubblicità dispositivo, ecc.) passato alla chiamata dell’evento. Esempio abbreviato: |
|
Stringa |
L’URL non codificato della pagina di riferimento (se presente). |
|
Stringa |
L’indirizzo IP del visitatore acquisito nella chiamata dell’evento. |
|
Stringa |
L'ID Experience Cloud (MID) assegnato al visitatore del sito. Vedi anche Cookie e il servizio identità Experience Platform Adobe . |
|
Matrice numerica |
Un array di ID di segmento che contiene segmenti realizzati in precedenza e nuovi segmenti per i quali il visitatore è qualificato. |
|
Matrice numerica |
Un array di ID di caratteristiche di prime e terze parti che contiene caratteristiche realizzate in precedenza e caratteristiche nuove per le quali il visitatore si è qualificato dall’ultimo feed di dati generato. |
Elenca e definisce la struttura dati di un file CDF. Sono inclusi sequenza di dati, delimitatori e separatori di campi, una mappa di file di dati e un file di esempio.
CDF i file non contengono colonne con etichetta o intestazioni di campo. Al contrario, un file CDF definisce campi e array con caratteri ASCII non stampabili. Inoltre, il file CDF elenca ogni campo e array in un ordine specifico. La comprensione degli identificatori e dell'ordine dei campi facilita l'analisi del file.
Elemento file CDF | Descrizione |
---|---|
Separatori di campi e delimitatori |
Questi caratteri non stampabili definiscono gli elementi e la struttura del file CDF:
|
Sequenza campi |
Importante: Audience Manager si riserva il diritto di aggiungere nuovi campi alla fine del file CDF nelle release future. Ciò significa che la progettazione tecnica del sistema di analisi dei file non deve assumere un numero fisso di colonne (anche se può assumere un ordine fisso per le colonne esistenti). I dati nel file CDF vengono visualizzati nell'ordine indicato di seguito.
Per le descrizioni dei campi, vedere Contenuto feed dati cliente definito. |
CDF i dati del file vengono visualizzati nell'ordine indicato di seguito.
Gli array in un file CDF iniziano e terminano con il separatore di campo Ctrl + a
. In questo modo il primo elemento di una matrice viene visualizzato come un campo di dati standalone. Ad esempio, l'array traits realizzato inizia con ^A1234
. Il delimitatore e l'ID della matrice ^B5678
seguono questa voce. Di conseguenza, si potrebbe essere tentati di pensare che il primo elemento nell'array traits realizzato sia ID 5678 (perché inizia con ^B
). Questo non è il caso, motivo per cui è necessario avere familiarità con la sequenza e la struttura di un file di dati. Anche se il primo elemento nell'array trait realizzato (o qualsiasi altro array in un file CDF) inizia con ^A
, l'ordine di aspetto o di posizione nel file definisce l'inizio di un array. Inoltre, il primo elemento di un array è sempre separato dalla voce precedente da ^A
.
Un file di esempio CDF potrebbe essere simile al seguente. In questo esempio sono state inserite interruzioni di riga per adattarle alla pagina.
Le sezioni seguenti elencano e definiscono gli elementi nel nome del file CDF.
Un nome di file tipico CDF contiene gli elementi elencati di seguito. Nota: italics indica un segnaposto variabile:
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz
Nel periodo di S3 archiviazione, i file vengono ordinati in ordine crescente in base all'ID partner (PID), al giorno e all'ora.
Nella tabella seguente sono elencati e definiti gli elementi in un nome di file CDF.
Elemento nome file | Descrizione |
---|---|
|
Si tratta del bucket di memorizzazione principale predefinito per il file CDF su un server Amazon S3 . |
|
Il nome del bucket S3 di sola lettura che contiene i file CDF. |
|
Data di elaborazione del file. |
|
Un valore di ora espresso in notazione a 24 ore e impostato nel fuso orario UTC. Vedi anche Tempi del nome del file dei feed di dati cliente e tempi del contenuto del file.... |
|
Il tuo ID partner. |
|
Un ID di processo interno Audience Manager. |
|
Estensione del file gzip. I file CDF vengono compressi con gzip. |
Audience Manager scrive un .info
file nella S3 directory per informarvi quando Customer Data File (CDF) è pronto per il download. Il file .info
include anche i metadati JSON formattati relativi al contenuto dei file CDF. Leggere questa sezione per informazioni sulla sintassi e i campi utilizzati da questo file di notifica.
Ogni file .info
contiene una sezione Files
e Totals
. La sezione Files
contiene un array che contiene metriche specifiche per ciascun file ogni ora. La sezione Totals
contiene metriche aggregate per tutti i file CDF relativi a un giorno specifico. Il contenuto del file .info
potrebbe essere simile al seguente esempio.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Le tabelle seguenti elencano e definiscono gli elementi in un file CDF .info
.
Campo | Descrizione |
---|---|
|
Avvia la matrice che contiene i metadati relativi ai file CDF. |
|
Dimensione del file in byte. |
|
Il Amazon S3 ETag. Il numero che segue il trattino mostra il numero di parti utilizzate per creare il file durante il caricamento di più parti. Il |
|
Nome del file. Vedere Convenzioni di denominazione dei file di feed di dati cliente. |
|
Numero di indice per ciascun file. |
Campo | Descrizione |
---|---|
|
Avvia l'oggetto che contiene dati aggregati su tutti i file CDF. |
|
Il giorno per il quale i dati sono disponibili. Utilizza il formato yyyy-mm-dd. |
|
L'ora per la quale i dati sono disponibili. Utilizza il formato 24 ore impostato nel fuso orario UTC. |
|
Dimensione totale in byte di tutti i file CDF per tale data. |
|
Numero totale di file caricati nella directory S3. |
Il file CDF contiene marche temporali nel nome del file e nel contenuto del file. Queste marche temporali registrano diversi processi di evento per lo stesso file CDF. Non è raro che il nome e il contenuto dello stesso file contengano marche temporali diverse. La comprensione di ciascuna marca temporale può aiutarti a evitare errori comuni quando lavori con questi dati o cerchi di ordinarli per ora.
CDF i file registrano il tempo in modo diverso in 2 posizioni separate.
Nella tabella seguente sono riportati ulteriori dettagli sulle marche temporali dei file CDF, oltre a informazioni su come utilizzarle correttamente.
Posizione timestamp | Descrizione |
---|---|
Nome file | La marca temporale nel nome del file CDF indica l'ora in cui Audience Manager ha iniziato a preparare il file per la consegna. Questa marca temporale è impostata nel fuso orario UTC. Utilizza il parametro hour= , con l'ora formattata come ora a 2 cifre nella notazione a 24 ore. Questa ora può essere diversa dall'ora dell'evento registrata nel contenuto del file. Quando lavori con CDF file, a volte noterai che il bucket S3 è vuoto per un'ora particolare. Un bucket vuoto può indicare una delle seguenti situazioni:
Importante: Non utilizzate la marca temporale del nome del file per raggruppare gli eventi per ora. Se è necessario raggruppare per ora, utilizzare la marca temporale EventTime nel contenuto del file. |
Sommario file | La marca temporale nel contenuto del file CDF indica l'ora in cui Data Collection Servers ha iniziato l'elaborazione del file. Questa marca temporale è impostata nel fuso orario UTC. Utilizza il campo EventTime , con il tempo formattato come yyyy-mm-dd hh:mm:ss . Questa ora è vicina all'ora effettiva dell'evento sulla pagina, ma può essere diversa dall'indicatore dell'ora nel nome del file. Suggerimento: A differenza della hour= marca temporale nel nome del file, è possibile raggruppare i dati EventTime per ora. |