Customer Data Feeds

Informazioni di base sui file Customer Data Feed (CDF) e istruzioni su come iniziare. Inizia da qui se sei interessato a ricevere i file CDF o se desideri solo ulteriori informazioni.

Contenuto e scopo del file

Un file CDF contiene gli stessi dati che una chiamata evento di Audience Manager (/event) invia ai nostri server. Ciò include dati come ID utente, trait IDs, segment IDs e tutti gli altri parametri acquisiti da una chiamata evento. I sistemi Audience Manager interni elaborano i dati evento in un file CDF con il contenuto organizzato in campi che vengono visualizzati in un ordine impostato. Audience Manager tenta di generare CDF i file ogni ora e li memorizza in un bucket sicuro specifico per il cliente su un Amazon S3 server. Forniamo questi file in modo che tu possa lavorare con i dati Audience Manager al di fuori dei limiti imposti dalla nostra interfaccia utente.

IMPORTANTE

Tieni presente le seguenti restrizioni quando lavori con i file CDF:

  • Prima di configurare la distribuzione di file CDF, assicurati di disporre delle autorizzazioni appropriate da parte di fornitori di dati terzi per l’esportazione di caratteristiche di terze parti. Al momento, Audience Manager non supporta le funzionalità dell’interfaccia utente per richiedere l’autorizzazione di esportazione per la consegna di file CDF da Fornitori di dati di terze parti, quindi contatta l’utente in modo indipendente.
  • Non utilizzare i file CDF come proxy per monitorare il traffico della pagina, riconciliare le discrepanze di report, o per la fatturazione, ecc.

Introduzione

Non esiste un processo self-service per avviare la consegna dei file CDF. Contatta il tuo consulente Audience Manager o l'Assistenza clienti per iniziare. Durante l'implementazione, il tuo Audience Manager rappresentante :

  • Imposta il bucket di archiviazione Amazon S3.
  • Immetti le credenziali di autenticazione di sola lettura S3 nel bucket di archiviazione dei file. Non potrai visualizzare o accedere a directory e file appartenenti ad altri clienti.

Le notifiche dei file e i file CDF verranno visualizzati nel bucket S3 quando sono pronti per il download. Sei responsabile del monitoraggio e del download dei file dalla directory S3 assegnata. Consulta Customer Data Feed File Processing Notifications.

Passaggi successivi

Le sezioni seguenti e le Domande frequenti sui feed di dati cliente possono aiutarti a acquisire maggiore familiarità con questo servizio.

Customer Data Feed Contenuto definito

Elenca e definisce gli elementi e gli array di dati in un file CDF in base all’ordine di aspetto. Le definizioni includono tipi di dati, ma queste informazioni non fanno parte di un file CDF.

Definizioni

Un file CDF include alcuni o tutti i campi definiti di seguito. Per informazioni sull'organizzazione interna dei file, vedere Struttura dei file dei feed di dati cliente.

Campo Tipo di dati Descrizione

Event Time

Timestamp

L'ora in cui un file CDF è stato elaborato da Data Collection Servers (DCS). La marca temporale utilizza il formato aaaa-mm-gg hh:mm:ss ed è impostata nel fuso orario UTC.

Nota: L'ora evento non è:

Device

Stringa

Si tratta dell’ ID utente univoco (UUID), che è un ID dispositivo a 38 cifre per il visitatore del sito. Vedi anche Indice degli ID in Audience Manager.

Container ID

Numeriche

ID del contenitore che attiva la sincronizzazione degli ID.

Realized Traits

Array numerico

Array di ID di caratteristiche che contiene tutte le caratteristiche realizzate (idonee) da un visitatore nella chiamata dell’evento.

L’array può contenere caratteristiche per le quali il visitatore si è qualificato in precedenza e per le quali è stato riqualificato tramite questa chiamata dell’evento.

Realized Segments

Array numerico

Array di ID segmento che contiene tutti i segmenti realizzati da un visitatore (qualificato per ) nella chiamata dell’evento.

Request Parameters

Stringa

Una stringa che acquisisce tutti i parametri (variabili, ID, coppie chiave-valore, ID pubblicità dispositivo, ecc.) passato nella chiamata dell'evento.

Esempio abbreviato:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type

Stringa

L’URL non codificato della pagina di riferimento (se presente).

IP Data Type

Stringa

L’indirizzo IP del visitatore acquisito nella chiamata dell’evento.

MCDevice

Stringa

L’ Experience Cloud ID (MID) assegnato al visitatore del sito. Consulta anche Cookie e il servizio Adobe Experience Platform Identity.

All Segments

Array numerico

Array di ID segmento che contiene i segmenti realizzati in precedenza e i nuovi segmenti per i quali il visitatore è qualificato.

All Traits

Array numerico

Array di ID di caratteristiche di prime e terze parti contenenti caratteristiche realizzate in precedenza e nuove caratteristiche per le quali il visitatore si è qualificato dall’ultimo feed di dati generato.

Customer Data Feed Struttura dei file

Elenca e definisce la struttura dati di un file CDF. Sono inclusi sequenza di dati, delimitatori e separatori di campi, una mappa file di dati e un file di esempio.

Identificatori dei campi dati e sequenza

CDF i file non contengono colonne o intestazioni di campo con etichetta. Al contrario, un file CDF definisce campi e array con caratteri ASCII non stampabili. Inoltre, il file CDF elenca ogni campo e matrice in un ordine specifico. La comprensione degli identificatori e dell’ordine dei campi consente di analizzare correttamente il file.

Elemento file CDF Descrizione

Separatori di campi e delimitatori

Questi caratteri non stampabili definiscono gli elementi e la struttura del file CDF:

  • Ctrl + a (ASCII 001 o ^A) separa i dati dei singoli campi con un indicatore di spazio non stampabile.
  • Ctrl + b (ASCII 002 o ^B) separa i dati da un array e richiede parametri.
  • Ctrl + c (ASCII 003 o ^C) definisce coppie chiave-valore.

Sequenza campi

Importante: Audience Manager si riserva il diritto di aggiungere nuovi campi alla fine del file CDF nelle versioni future. Ciò significa che la progettazione tecnica del sistema di analisi dei file non deve assumere un numero fisso di colonne (anche se può assumere un ordine fisso per le colonne esistenti).

I dati nel file CDF vengono visualizzati nell’ordine indicato di seguito.

  1. Ora evento
  2. Dispositivo
  3. ID contenitore
  4. Caratteristiche realizzate
  5. Segmenti realizzati
  6. Parametri di richiesta
  7. Referente
  8. Indirizzo IP
  9. ID dispositivo di Experience Cloud (o MID). Consulta anche Cookie e il servizio Adobe Experience Platform Identity
  10. Tutti i segmenti
  11. Tutte le caratteristiche

Per le descrizioni dei campi, vedere Contenuto del feed di dati cliente definito.

CDF Mappa dei file

CDF i dati del file vengono visualizzati nell’ordine indicato di seguito.

Identificazione di array

Gli array in un file CDF iniziano e terminano con il separatore di campo Ctrl + a. In questo modo il primo elemento di un array viene visualizzato come un campo dati autonomo. Ad esempio, l'array realizzato traits inizia con ^A1234. Il delimitatore e l'ID della matrice ^B5678 seguono questa voce. Di conseguenza, si potrebbe essere tentati di pensare che il primo elemento dell'array realizzato traits sia ID 5678 (perché inizia con ^B). Questo non è il caso, ed è per questo che devi avere familiarità con la sequenza e la struttura di un file di dati. Anche se il primo elemento dell'array trait realizzato (o di qualsiasi altro array in un file CDF) inizia con ^A, l'ordine di aspetto o di posizione nel file definisce l'inizio di un array. Inoltre, il primo elemento di un array è sempre separato dalla voce precedente da ^A.

Esempio di file CDF

Un file di esempio CDF potrebbe avere un aspetto simile al seguente. In questo esempio sono state inserite interruzioni di riga per adattarle alla pagina.

Customer Data Feed Convenzioni di denominazione dei file

Le sezioni seguenti elencano e definiscono gli elementi nel nome del file CDF.

CDF Nome file: Sintassi ed esempio

Un nome file CDF tipico contiene gli elementi elencati di seguito. Nota: corsivo indica un segnaposto variabile:

Sintassi

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Esempio

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

Nel bucket di archiviazione S3, i file vengono ordinati in ordine crescente in base all'ID partner (PID), al giorno e all'ora.

CDF Elementi del nome file definiti

Nella tabella seguente sono elencati e definiti gli elementi in un nome di file CDF.

Elemento Nome file Descrizione

s3://aam-cdf/

Questo è il bucket di archiviazione principale predefinito per il file CDF su un server Amazon S3.

your S3 bucket name

Il nome del bucket S3 di sola lettura che contiene i file CDF.

day=yyyy-mm-dd

Data di elaborazione del file.

hour=hh

Un valore di ora espresso in notazione 24 ore e impostato nel fuso orario UTC. Vedi anche Customer Data Feed File Name Times e File Content Times...

partner ID

Il tuo ID partner.

AAM process ID_0

Un ID di processo interno Audience Manager.

.gz

Estensione del file gzip. I file CDF sono compressi con Gzip.

Customer Data Feed Notifiche di elaborazione dei file

Audience Manager scrive un .info file nella tua S3 directory per informarti quando il tuo Customer Data File (CDF) è pronto per il download. Il file .info include anche JSON metadati formattati sul contenuto dei file CDF. Leggi questa sezione per informazioni sulla sintassi e i campi utilizzati da questo file di notifica.

File di informazioni di esempio

Ogni file .info contiene una sezione Files e Totals. La sezione Files contiene un array che contiene metriche specifiche per ciascun file ogni ora. La sezione Totals contiene metriche aggregate per tutti i file CDF di un giorno specifico. Il contenuto del file .info potrebbe avere un aspetto simile al seguente esempio.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Campi file di informazioni definiti

Le tabelle seguenti elencano e definiscono gli elementi in un file CDF .info .

Oggetto Files

Campo Descrizione

Files

Avvia la matrice che contiene i metadati sui file CDF.

FileByteSize

Dimensione del file in byte.

FileChecksumMD5

Amazon S3 ETag. Il numero che segue il trattino mostra il numero di parti utilizzate per creare il file durante il caricamento in più parti. Il ETag non è identico al checksum MD5 del file.

FileName

Nome del file. Consulta Customer Data Feed File Naming Conventions.

FileSequenceNumber

Numero di indice per ciascun file.

Oggetto Totals

Campo Descrizione

Totals

Avvia l'oggetto che contiene dati aggregati su tutti i file CDF.

Day

Il giorno per cui i dati sono disponibili. Utilizza il formato aaaa-mm-gg.

Hour

L’ora per la quale i dati sono disponibili. Utilizza il formato 24 ore impostato nel fuso orario UTC.

TotalByteSize

Dimensione totale in byte di tutti i file CDF per quella data.

TotalNumberFiles

Numero totale di file caricati nella directory S3.

Customer Data Feed I tempi e i tempi del contenuto dei file sono diversi

Il file CDF contiene timestamp nel nome del file e nel contenuto del file. Queste marche temporali registrano diversi processi evento per lo stesso file CDF. Non è raro visualizzare marche temporali diverse nel nome e nel contenuto dello stesso file. La comprensione di ogni marca temporale può aiutarti a evitare errori comuni quando lavori con questi dati o provi a ordinarli per tempo.

Individuazione di CDF timestamp file

CDF i file registrano il tempo in modo diverso in 2 posizioni separate.

Differenza tra marche temporali

La tabella seguente fornisce ulteriori dettagli sulle marche temporali del file CDF insieme a informazioni su come utilizzarle correttamente.

Posizione timestamp Descrizione
Nome file La marca temporale nel nome del file CDF indica l’ora in cui Audience Manager ha iniziato a preparare il file per la consegna. Questa marca temporale è impostata nel fuso orario UTC. Utilizza il parametro hour=, con il tempo formattato come ora a 2 cifre nella notazione a 24 ore. Questa ora può essere diversa da quella registrata nel contenuto del file. Quando lavori con i file CDF, a volte noterai che il tuo bucket S3 è vuoto per un’ora specifica. Un bucket vuoto indica che può indicare uno dei seguenti elementi:
  • Non ci sono dati per quell'ora in particolare.
  • I nostri server sono sotto carichi pesanti e non possono elaborare i file per un'ora specifica. Quando il server raggiunge, inserisce i file che avrebbero dovuto essere presenti in un file bucket di una data precedente in un bucket con un valore di tempo successivo. Ad esempio, lo vedrai quando un file che dovrebbe essere stato nel bucket ore 17 verrà visualizzato nel bucket ore 18 (con hour=18 nel nome del file). In questo caso, probabilmente il server ha iniziato l'elaborazione del file nell'ora 17 ma non è riuscito a completarlo entro tale intervallo di tempo. Al contrario, il file viene inviato al bucket ora oraria successivo.

Importante: Non utilizzare la marca temporale del nome file per raggruppare gli eventi per ora. Se devi raggruppare per ora, utilizza la marca temporale EventTime nel contenuto del file.
Contenuto del file La marca temporale nel contenuto del file CDF indica il momento in cui Data Collection Servers ha iniziato a elaborare il file. Questa marca temporale è impostata nel fuso orario UTC. Utilizza il campo EventTime, con il tempo formattato come yyyy-mm-dd hh:mm:ss. Questa ora è vicina all'ora effettiva dell'evento sulla pagina, ma può essere diversa dall'indicatore dell'ora nel nome del file.
Suggerimento: A differenza della hour= marca temporale nel nome del file, è possibile utilizzare EventTime per raggruppare i dati per ora.

In questa pagina