Customer Data Feeds customer-data-feeds
Información básica sobre Customer Data Feed los archivos (CDF) e instrucciones sobre cómo empezar. Inicio aquí si está interesado en recibir CDF archivos o simplemente desea más información.
Archivo Contenido y finalidad file-contents-purpose
Un CDF archivo contiene los mismos datos que una Audience Manager llamada de evento (/event
) envía a nuestros servidores. Esto incluye los datos gustar los ID de usuario, trait IDs, segment IDsy todos los demás parámetros capturados por una llamada de evento. Los procesos de sistemas internos Audience Manager datos de evento en un CDF archivo con contenido organizados en campos que aparecen en un orden establecido. Audience Manager Intenta generar CDF archivos cada hora y los almacena en un bloque seguro y específico del cliente en un Amazon S3 servidor. Proporcionamos estos archivos para que pueda trabajar con Audience Manager datos fuera de los límites impuestos por nuestra interfaz de usuario.
- Antes de configurar el envío de archivo CDF, asegúrese de tener los permisos adecuados de terceros proveedores de datos para la exportación de terceros características. Audience Manager actualmente no admite funcionalidad en la interfaz de usuario para solicitud archivo CDF envío exportar permiso de proveedores de datos de terceros, así que comuníquese con ellos de forma independiente.
- No debe utilizar CDF los archivos como proxy para monitor Página tráfico, conciliar discrepancias en el informe, o para facturación, etc.
Introducción getting-started
No hay ningún proceso de autoservicio para inicio CDF archivo envío. Para comenzar, póngase en contacto con su asesor o con el Audience Manager Servicio de atención al cliente. Durante implementación, su Audience Manager representante:
- Configure el bucket de Amazon S3 almacenamiento.
- Proporcione credenciales de autenticación de solo S3 lectura a su archivo almacenamiento bucket. No podrá ver ni acceder a directorios y archivos que pertenezcan a otros clientes.
Archivo notificaciones y CDF archivos aparecerán en su S3 bucket cuando estén listos para descargar. Usted es responsable de supervisar y descargar archivos de su directorio asignado S3 . Consulte Notificaciones sobre procesamiento de archivos de fuentes de datos de clientes.
Pasos siguientes next-steps
Las secciones siguientes y las preguntas frecuentes sobre la fuente de datos delcliente pueden ayudarle a familiarizarse con este servicio.
Customer Data Feed Contenido definido cdf-defined
Enumera y define los elementos de datos y las matrices de un CDF archivo, por orden de apariencia. Las definiciones incluyen tipos de datos, pero esta información no forma parte de un CDF archivo.
Definiciones definitions
Un CDF archivo incluye algunos o todos los campos definidos a continuación. Para obtener información sobre la organización interna de archivos, consulte Estructura del Archivo de la fuente de datos del cliente.
Event Time
La hora en que un archivo CDF fue procesado por los servidores de recopilación de datos (DCS). La marca de hora utiliza la formato aaaa-mm-dd hhss y se establece en la zona horaria UTC.
Nota: El Tiempo del evento no es:
- La hora de la Página evento o la evento se llaman a sí mismas, aunque puede estar cerca de esas horas.
- Relacionado con la hora DCS en el nombre del archivo. Consulte también Fuente de datos del cliente Archivo Horas de nombres y Archivo Horas de contenido....
Device
Container ID
Realized Traits
Matriz de ID de rasgos que contiene todas las características que un visitante ha obtenido (para el que está cualificado) en la llamada de evento.
Tenga en cuenta que la matriz puede contener características para las que el visitante había calificado antes y para las que vuelve a calificar a través de esta llamada de evento.
Realized Segments
Request Parameters
Una cadena que captura todos los parámetros (variables, ID, pares clave-valor, ID dispositivos publicidad, etc.) transferidos en la llamada evento.
Ejemplo abreviado:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Customer Data Feed Estructura Archivo cdf-file-structure
Enumera y define la estructura de datos de un CDF archivo. Esto incluye Secuencia de datos, delimitadores y separadores de campo, un mapa de archivos de datos y un archivo de muestra.
Secuencia e identificadores de campo de datos identifiers-and-sequence
CDF Los archivos no contienen columnas ni encabezados de campo etiquetados. En su lugar, un archivo define campos CDF y matrices con caracteres de no impresión ASCII . Además, el CDF archivo enumera cada campo y matriz en un orden específico. Comprender los identificadores de campo y el orden le ayudará a analizar el archivo correctamente.
Estos caracteres de no impresión definen los elementos y la estructura de su archivo CDF:
- Ctrl + a (ASCII
001
o^A
) separa los datos de campos individuales con un indicador de espacio de no impresión. - Ctrl + b (ASCII
002
o^B
) separa los datos de una matriz y solicitud parámetros. - Ctrl + c (ASCII
003
o^C
) define pares clave-valor.
Importante: Audience Manager se reserva el derecho de añadir nuevos campos al final del archivo CDF en futuras versiones. Esto significa que el diseño técnico del sistema de análisis de archivos no debe suponer un número fijo de columnas (aunque puede suponer un orden fijo para las columnas existentes).
Los datos en su archivo CDF aparecen en el orden que se muestra a continuación. /N puede aparecer en lugar de cualquiera de estos campos, lo que indica un valor nulo.
- Hora del evento
- Device
- ID de contenedor
- Características realizadas
- Segmentos realizados
- Parámetros de solicitud
- Sitio de referencia
- Dirección IP
- Experience Cloud ID de dispositivo (o MID). Consulte también Cookies y el servicio de identidad de Adobe Experience Platform
- Todos los segmentos
- Todas las características
Para ver descripciones de los campos, consulte Definición del contenido de la fuente de datos del cliente.
CDF Mapa Archivo cdf-file-map
CDF Los datos del archivo aparecen en el orden que se muestra a continuación.
Identificación de matrices
Las matrices de un CDF archivo inicio y terminan con el separador de Ctrl + a
campos. Esto hace que el primer elemento de una matriz aparezca gustar campo de datos independiente. Por ejemplo, la matriz realizada traits comienza con ^A1234
. El ID y el delimitador ^B5678
de la matriz siguen a esta entrada. Como resultado, podría sentirse tentado a pensar que el primer elemento en la matriz realizada traits es ID 5678 (porque comienza con ^B
). Este no es el caso, por lo que debe estar familiarizado con el Secuencia y la estructura de un archivo de datos. Aunque el primer elemento de la matriz realizada trait (o cualquiera de las otras matrices de un CDF archivo) comienza con ^A
, el orden de aparición o posición en el archivo define la inicio de una matriz. Y, el primer elemento de una matriz siempre está separado de la entrada anterior por ^A
.
Ejemplo CDF de Archivo sample-file
Un archivo de muestra CDF puede tener un aspecto similar al siguiente. Hemos insertado saltos de línea en este ejemplo para ayudar a que se ajuste al Página.
Customer Data Feed Archivo convenciones de nomenclatura cdf-naming-conventions
Las secciones siguientes lista y definen los elementos en CDF su nombre de archivo.
CDF Nombre de Archivo: sintaxis y ejemplo cdf-file-name
Un nombre de archivo típico CDF contiene los elementos enumerados a continuación. Nota: La letra en cursiva indica un marcador de posición variable:
Sintaxis
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
Ejemplo
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
En su S3 bloque almacenamiento, los archivos se ordenan de forma ascendente por ID de socio (PID), día y hora.
CDF Archivo Elementos de nombre definidos cdf-file-name-elements
En la tabla siguiente se enumeran y definen los elementos de un CDF nombre de archivo.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed Archivo notificaciones de procesamiento cdf-file-processing-notifications
Audience Manager escribe un .info
archivo en el S3 directorio para avisarle cuando su Customer Data File (CDF) esté listo para descargar. El .info
archivo también incluye JSON metadatos con formato sobre el contenido de los CDF archivos. Consulte esta sección para obtener información sobre la sintaxis y los campos utilizados por este archivo notificación.
Información de muestra Archivo sample-info-file
Cada .info
archivo contiene una Files
sección and Totals
. Esta Files
sección contiene una matriz que contiene métricas específicas para cada archivo por hora. Esta Totals
sección contiene métricas agregadas en todos los CDF archivos para un día en particular. El contenido del .info
archivo podría ser similar al del siguiente ejemplo.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Información Archivo campos definidos info-file-fields-defined
Las tablas siguientes lista y definen los elementos de un CDF .info
archivo.
Archivos objeto
Files
FileByteSize
FileChecksumMD5
ETag
no es idéntico a la suma de comprobación MD5 del archivo.FileName
FileSequenceNumber
Objeto Totales
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed Nombre Archivo Las horas y las horas del contenido Archivo son diferentes different-processing-times
El CDF archivo contiene marcas de tiempo en el nombre y el contenido del archivo. Estas marcas de tiempo registran diferentes procesos evento para el mismo CDF archivo. No es raro ver diferentes marcas de tiempo en el nombre y el contenido del mismo archivo. Comprender cada marca de tiempo puede ayudarlo a evitar errores comunes al trabajar con estos datos o intentar ordenarlos por tiempo.
Localización CDF de marcas de hora de Archivo locating-timestamps
CDF Los archivos registran el tiempo de manera diferente en 2 ubicaciones separadas.
Comprender la diferencia entre marcas de hora understanding-timestamps
En la tabla siguiente se proporcionan detalles adicionales sobre las marcas de tiempo de los CDF archivos, así como información sobre cómo utilizarlos correctamente.
La marca de tiempo en el nombre de archivo marca el momento en CDF el que Audience Manager se comenzó a preparar el archivo para la envío. Esta marca de tiempo se establece en la UTC zona horaria. Utiliza el parámetro, con el formato de hour=
hora como una hora de 2 dígitos en notación de 24 horas. Este tiempo puede ser diferente del tiempo de evento registrado en el contenido del archivo. Al trabajar con CDF archivos, a veces notará que su S3 cubo está vacío durante una hora en particular. Un bucket vacío significa que puede significar cualquiera de los siguientes medios:
- No hay datos para esa hora en particular.
- Nuestros servidores están sometidos a cargas pesadas y no pueden procesar archivos durante una hora en particular. Cuando el servidor se pone al día, coloca los archivos que deberían haber ido en un bucket de tiempo anterior en un bucket con un valor de tiempo posterior. Por ejemplo, verá esto cuando un archivo que debería haber estado en el cubo de la hora 17 aparezca en el cubo de la hora 18 (con
hour=18
en el nombre del archivo). En este caso, el servidor probablemente comenzó a procesar su archivo en la hora 17 pero no pudo completarlo dentro de ese intervalo de tiempo. En su lugar, el archivo se inserta en el siguiente bloque de tiempo por hora.
Importante: No utilice la marca de tiempo del nombre de archivo para grupo eventos por tiempo. Si necesita grupo por tiempo, utilice la marca de EventTime
tiempo en el contenido del archivo.
EventTime
tiempo como yyyy-mm-dd hh:mm:ss
. Esta hora es cercana a la hora real de la evento en el Página, pero puede ser diferente del indicador de hora en el nombre del archivo.Sugerencia: a diferencia de la marca de
hour=
tiempo en el nombre del archivo, puede usar EventTime
para grupo datos por tiempo.