Customer Data Feeds customer-data-feeds
Información básica sobre Customer Data Feed (CDF) archivos e instrucciones sobre cómo comenzar. Comience aquí si está interesado en recibir CDF archivos o simplemente desea más información.
Contenido y propósito del archivo file-contents-purpose
Un archivo de CDF contiene los mismos datos que una llamada de evento de Audience Manager (/event
) envía a nuestros servidores. Esto incluye datos como los identificadores de usuario, trait IDs, segment IDs y todos los demás parámetros capturados por una llamada de evento. Los sistemas internos Audience Manager procesan los datos de evento en un archivo CDF con contenido organizado en campos que aparecen en un orden definido. Audience Manager intenta generar CDF archivos cada hora y los almacena en un contenedor seguro y específico del cliente en un servidor Amazon S3. Proporcionamos estos archivos para que pueda trabajar con datos de Audience Manager fuera de los límites impuestos por nuestra interfaz de usuario.
- Antes de configurar la entrega de archivos CDF, asegúrese de que dispone de los permisos adecuados de los proveedores de datos de terceros para la exportación de características de terceros. Actualmente, Audience Manager no admite la funcionalidad en la interfaz de usuario para solicitar a los proveedores de datos de terceros el permiso de exportación de entrega de archivos CDF, por lo que debe ponerse en contacto con ellos de forma independiente.
- No debe usar CDF archivos como proxy para supervisar el tráfico de la página, reconciliar discrepancias en los informes o para facturación, etc.
Introducción getting-started
No hay ningún proceso de autoservicio para iniciar la entrega de archivos de CDF. Póngase en contacto con su asesor de Audience Manager o con el Servicio de atención al cliente para comenzar. Durante la implementación, su representante de Audience Manager:
- Configure su espacio de almacenamiento de Amazon S3.
- Proporcione credenciales de autenticación S3 de solo lectura al espacio de almacenamiento de archivos. No podrá ver ni acceder a directorios y archivos que pertenezcan a otros clientes.
Las notificaciones de archivos y los archivos de CDF aparecerán en su bloque de S3 cuando estén listos para su descarga. Usted es responsable de supervisar y descargar archivos desde el directorio S3 asignado. Consulte Notificaciones sobre procesamiento de archivos de fuentes de datos de clientes.
Pasos siguientes next-steps
Las secciones siguientes y las Preguntas frecuentes sobre la fuente de datos del cliente pueden ayudarle a familiarizarse con este servicio.
Customer Data Feed contenidos definidos cdf-defined
Enumera y define los elementos de datos y las matrices de un archivo de CDF, por orden de aparición. Las definiciones incluyen tipos de datos, pero esta información no forma parte de un archivo CDF.
Definiciones definitions
Un archivo de CDF incluye algunos o todos los campos definidos a continuación. Para obtener información acerca de la organización interna de archivos, consulte Estructura de archivos de fuentes de datos de clientes.
Event Time
Hora a la que los servidores de recopilación de datos (DCS) procesaron un archivo CDF. La marca de tiempo usa el formato aaaa-mm-dd hhss y está establecida en la zona horaria UTC.
Nota: La hora del evento no es :
- La hora del evento de página o la propia llamada de evento, aunque puede estar cerca de esas horas.
- Relacionado con la hora DCS en el nombre de archivo. Consulte también horas del nombre de archivo de la fuente de datos del cliente y horas del contenido de archivo....
Device
Container ID
Realized Traits
Una matriz de ID de rasgos que contiene todos los rasgos para los que un visitante se dio cuenta (cualificado) en la llamada de evento.
Tenga en cuenta que la matriz puede contener características para las que el visitante había cumplido los requisitos antes y para las que volvió a clasificarse a través de esta llamada de evento.
Realized Segments
Request Parameters
Una cadena que captura todos los parámetros (variables, ID, pares clave-valor, ID de publicidad de dispositivo, etc.) pasado en la llamada de evento.
Ejemplo abreviado:
d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583
Referer Data Type
IP Data Type
MCDevice
All Segments
All Traits
Estructura de archivos de Customer Data Feed cdf-file-structure
Enumera y define la estructura de datos de un archivo de CDF. Esto incluye la secuencia de datos, los delimitadores y separadores de campo, un mapa del archivo de datos y un archivo de muestra.
Identificadores y secuencia de campos de datos identifiers-and-sequence
CDF archivos no contienen columnas etiquetadas ni encabezados de campo. En su lugar, un archivo de CDF define campos y matrices con ASCII caracteres que no se imprimen. Además, el archivo CDF enumera cada campo y matriz en un orden específico. Comprender los identificadores de campo y el orden le ayudará a analizar el archivo correctamente.
Estos caracteres no imprimibles definen los elementos y la estructura del archivo CDF:
- Ctrl + a (ASCII
001
o^A
) separa los datos de los campos individuales con un indicador de espacio no imprimible. - Ctrl + b (ASCII
002
o^B
) separa los datos de una matriz y los parámetros de solicitud. - Ctrl + c (ASCII
003
o^C
) define pares clave-valor.
Importante: Audience Manager se reserva el derecho de agregar nuevos campos al final del archivo CDF en futuras versiones. Esto significa que el diseño técnico del sistema de análisis de archivos no debe suponer un número fijo de columnas (aunque puede suponer un orden fijo para las columnas existentes).
Los datos del archivo CDF aparecen en el orden indicado a continuación. /N puede aparecer en lugar de cualquiera de estos campos, lo que indica un valor nulo.
- Hora del evento
- Device
- ID de contenedor
- Características realizadas
- Segmentos realizados
- Parámetros de solicitud
- Referer
- Dirección IP
- ID del dispositivo del Experience Cloud (o MID). Consulte también cookies y el servicio de identidad de Adobe Experience Platform
- Todos los segmentos
- Todas las características
Para obtener descripciones de los campos, consulte Contenido de fuente de datos del cliente definido.
Asignación de archivo de CDF cdf-file-map
CDF los datos del archivo aparecen en el orden que se muestra a continuación.
Identificación de matrices
Las matrices de un archivo CDF comienzan y finalizan con el separador de campos Ctrl + a
. Esto hace que el primer elemento de una matriz parezca un campo de datos independiente. Por ejemplo, la matriz traits realizada comienza con ^A1234
. El delimitador de matriz y el identificador ^B5678
siguen esta entrada. Como resultado, puede sentirse tentado a pensar que el primer elemento de la matriz traits realizada es el identificador 5678 (porque comienza con ^B
). Este no es el caso, por lo que debe estar familiarizado con la secuencia y estructura de un archivo de datos. Aunque el primer elemento de la matriz trait realizada (o cualquiera de las demás matrices de un archivo CDF) comience por ^A
, el orden de aparición o posición en el archivo define el inicio de una matriz. Y, el primer elemento de una matriz siempre está separado de la entrada anterior por ^A
.
Archivo de muestra CDF sample-file
Un archivo de muestra CDF podría tener un aspecto similar al siguiente. Hemos insertado saltos de línea en este ejemplo para que se ajuste a la página.
Customer Data Feed Convenciones de nombres de archivos cdf-naming-conventions
Las secciones siguientes enumeran y definen los elementos del nombre de archivo CDF.
CDF Nombre de archivo: sintaxis y ejemplo cdf-file-name
Un nombre de archivo típico de CDF contiene los elementos que se enumeran a continuación. Tenga en cuenta que cursiva indica un marcador de posición de variable:
Sintaxis
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
Ejemplo
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
En el espacio de almacenamiento de S3, los archivos se ordenan en orden ascendente por id. de socio (PID), día y hora.
CDF elementos de nombre de archivo definidos cdf-file-name-elements
En la tabla siguiente se enumeran y definen los elementos de un nombre de archivo de CDF.
s3://aam-cdf/
your S3 bucket name
day=yyyy-mm-dd
hour=hh
partner ID
File Sequence_0
.gz
Customer Data Feed notificaciones de procesamiento de archivos cdf-file-processing-notifications
Audience Manager escribe un archivo de .info
en el directorio S3 para que sepa cuándo su Customer Data File (CDF) está listo para su descarga. El archivo .info
también incluye JSON metadatos con formato acerca del contenido de los archivos CDF. Revise esta sección para obtener información sobre la sintaxis y los campos utilizados por este archivo de notificación.
Archivo de información de muestra sample-info-file
Cada archivo .info
contiene una sección Files
y Totals
. La sección Files
contiene una matriz que contiene métricas específicas para cada archivo por hora. La sección Totals
contiene métricas agregadas en todos sus archivos de CDF para un día en particular. El contenido del archivo .info
podría ser similar al del siguiente ejemplo.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Campos de archivo de información definidos info-file-fields-defined
Las siguientes tablas enumeran y definen los elementos de un archivo CDF .info
.
Objeto Files
Files
FileByteSize
FileChecksumMD5
ETag
no es idéntico a la suma de comprobación MD5 del archivo.FileName
FileSequenceNumber
Objeto Totals
Totals
Day
Hour
TotalByteSize
TotalNumberFiles
Customer Data Feed Las horas de nombre de archivo y las horas de contenido de archivo son diferentes different-processing-times
El archivo CDF contiene marcas de tiempo en el nombre y el contenido del archivo. Estas marcas de tiempo registran diferentes procesos de evento para el mismo archivo CDF. No es raro ver marcas de tiempo diferentes en el nombre y el contenido del mismo archivo. Comprender cada marca de tiempo puede ayudarle a evitar errores comunes al trabajar con estos datos o al intentar ordenarlos por tiempo.
Buscando CDF marcas de tiempo de archivos locating-timestamps
CDF archivos registran el tiempo de forma diferente en dos ubicaciones independientes.
Explicación de la diferencia entre marcas de tiempo understanding-timestamps
La siguiente tabla proporciona detalles adicionales sobre las marcas de tiempo del archivo CDF, así como información sobre cómo utilizarlas correctamente.
La marca de tiempo del nombre de archivo CDF indica la hora en que Audience Manager comenzó a preparar el archivo para su envío. Esta marca de tiempo se establece en la zona horaria UTC. Utiliza el parámetro hour=
, con el formato de hora de 2 dígitos en notación de 24 horas. Esta hora puede ser diferente a la hora del evento registrada en el contenido del archivo. Al trabajar con CDF archivos, a veces observará que el espacio de S3 está vacío durante una hora determinada. Un bloque vacío significa que puede significar cualquiera de las siguientes opciones:
- No hay datos para esa hora en particular.
- Nuestros servidores están bajo cargas pesadas y no pueden procesar archivos durante una hora en particular. Cuando el servidor se pone al día, coloca los archivos que deberían haber estado en un bloque de tiempo anterior en un bloque con un valor de tiempo posterior. Por ejemplo, verá esto cuando un archivo que debería haber estado en el bloque de horas 17 aparezca en el bloque de horas 18 (con
hour=18
en el nombre del archivo). En este caso, es probable que el servidor haya empezado a procesar el archivo en la hora 17, pero no haya podido completarlo en ese intervalo de tiempo. En su lugar, el archivo se inserta en el siguiente bloque de tiempo por hora.
Importante: no use la marca de tiempo del nombre de archivo para agrupar los eventos por hora. Si necesita agrupar por tiempo, utilice la marca de tiempo EventTime
en el contenido del archivo.
EventTime
, con el formato de hora yyyy-mm-dd hh:mm:ss
. Esta hora está cerca de la hora real del evento en la página, pero puede ser diferente al indicador de hora del nombre del archivo.Sugerencia: A diferencia de la marca de tiempo
hour=
en el nombre de archivo, puede usar EventTime
para agrupar los datos por hora.