Información básica sobre Customer Data Feed (CDF) archivos e instrucciones sobre cómo empezar. Comience aquí si está interesado en recibir CDF archivos o simplemente desea obtener más información.
Un archivo CDF contiene los mismos datos que una llamada de evento de Audience Manager (/event
) envía a nuestros servidores. Esto incluye datos como ID de usuario, trait IDs, segment IDsy todos los demás parámetros capturados por una llamada de evento. Interno Audience Manager procesa los datos de evento en una CDF archivo con contenido organizado en campos que aparecen en un orden definido. Audience Manager intenta generar CDF archivos por hora y los almacena en un espacio seguro y específico del cliente en un Amazon S3 servidor. Proporcionamos estos archivos para que pueda trabajar con Audience Manager datos fuera de los límites impuestos por nuestra interfaz de usuario.
Tenga en cuenta las siguientes restricciones al trabajar con archivos CDF:
No hay ningún proceso de autoservicio para iniciar CDF envío de archivos. Póngase en contacto con su Audience Manager consultor o con el Servicio de atención al cliente para empezar. Durante la implementación, su Audience Manager el representante:
Notificaciones de archivos y CDF Los archivos aparecerán en su S3 cubos cuando estén listos para descargar. Usted es responsable de supervisar y descargar archivos de su asignado S3 directorio. Consulte Notificaciones sobre procesamiento de archivos de fuentes de datos de clientes.
Las secciones siguientes y la Preguntas frecuentes sobre fuentes de datos de clientes puede ayudarle a familiarizarse con este servicio.
Enumera y define los elementos de datos y las matrices de una CDF archivo, por orden de aparición. Las definiciones incluyen tipos de datos, pero esta información no forma parte de un CDF archivo.
Los píxeles de evento se excluyen de forma predeterminada en las configuraciones de CDF. Asegúrese de especificar en la solicitud al servicio de atención al cliente si desea que los píxeles de evento se incluyan en los archivos CDF. Cada píxel de evento se rellenará como una fila única en los archivos CDF.
A CDF incluye algunos o todos los campos definidos a continuación. Para obtener información sobre la organización interna de archivos, consulte Estructura de archivo de fuente de datos del cliente.
Campo | Tipo de datos | Descripción |
---|---|---|
|
Marca de tiempo |
Hora a la que el administrador procesó un archivo CDF Servidores de recopilación de datos (DCS). La marca de tiempo utiliza el yyyy-mm-dd hh:mm:ss y se establece en la zona horaria UTC.
Nota: La Hora Del Evento no es:
|
|
Cadena |
Este es el ID de usuario único (UUID), que es un ID de dispositivo de 38 dígitos para el visitante del sitio. Consulte también Índice de ID en Audience Manager. |
|
Numérica |
El ID del contenedor que activa la sincronización de ID. Este campo solo se rellena si establece el ID de contenedor en la variable d_nsid dentro de la implementación del sitio. De lo contrario, el valor predeterminado de 0 no se incluirá en los archivos CDF. |
|
Matriz numérica |
Una matriz de ID de rasgos que contiene todos los rasgos para los que un visitante se dio cuenta (cualificado) en la llamada de evento. Tenga en cuenta que la matriz puede contener características para las que el visitante había cumplido los requisitos antes y para las que volvió a clasificarse a través de esta llamada de evento. |
|
Matriz numérica |
Matriz de ID de segmento que contiene todos los segmentos para los que el visitante se dio cuenta (para los que cumple los requisitos) en la llamada de evento. |
|
Cadena |
Una cadena que captura todos los parámetros (variables, ID, pares clave-valor, ID de publicidad de dispositivo, etc.) pasado en la llamada de evento. Ejemplo abreviado: |
|
Cadena |
La dirección URL sin codificar de la página de referencia (si la hay). |
|
Cadena |
La dirección IP del visitante capturada en la llamada de evento. |
|
Cadena |
El Experience Cloud ID asignado al visitante del sitio. Consulte también. Cookies y el servicio de ID del Experience Platform de Adobe. |
|
Matriz numérica |
Matriz de ID de segmento que contiene segmentos para los que se ha realizado anteriormente y nuevos segmentos para los que el visitante está cualificado. |
|
Matriz numérica |
Una matriz de ID de rasgos de origen y de terceros que contiene rasgos realizados anteriormente y nuevos rasgos para los que el visitante ha cumplido los requisitos desde la última fuente de datos generada. |
Enumera y define la estructura de datos de un CDF archivo. Esto incluye la secuencia de datos, los delimitadores y separadores de campo, un mapa del archivo de datos y un archivo de muestra.
CDF los archivos no contienen columnas etiquetadas ni encabezados de campo. En su lugar, un CDF define campos y matrices con elementos no imprimibles ASCII caracteres. Además, la variable CDF El archivo enumera cada campo y matriz en un orden específico. Comprender los identificadores de campo y el orden le ayudará a analizar el archivo correctamente.
Elemento de archivo CDF | Descripción |
---|---|
Separadores y delimitadores de campos |
Estos caracteres no imprimibles definen los elementos y la estructura del archivo CDF:
|
Secuencia de campos |
Importante: Audience Manager se reserva el derecho de añadir nuevos campos al final del archivo CDF en futuras versiones. Esto significa que el diseño técnico del sistema de análisis de archivos no debe suponer un número fijo de columnas (aunque puede suponer un orden fijo para las columnas existentes). Los datos del archivo CDF aparecen en el orden indicado a continuación. /N puede aparecer en lugar de cualquiera de estos campos, lo que indica un valor nulo.
Para ver las descripciones de los campos, consulte Contenido de fuente de datos de cliente definido. |
CDF los datos del archivo aparecen en el orden mostrado a continuación.
Matrices en una CDF inicio y final del archivo con Ctrl + a
separador de campos. Esto hace que el primer elemento de una matriz parezca un campo de datos independiente. Por ejemplo, la cuenta traits la matriz empieza por ^A1234
. El delimitador de matriz y el ID ^B5678
sigue esta entrada. Como resultado, puede sentirse tentado a pensar que el primer elemento de la imagen realizada traits La matriz es el ID 5678 (porque comienza con ^B
). Este no es el caso, por lo que debe estar familiarizado con la secuencia y estructura de un archivo de datos. A pesar de que el primer elemento en el realizado trait matriz (o cualquiera de las otras matrices de una CDF file) empieza por ^A
, el orden de aparición o posición en el archivo define el inicio de una matriz. Y, el primer elemento de una matriz siempre se separa de la entrada anterior por ^A
.
Una muestra CDF podría tener un aspecto similar al siguiente. Hemos insertado saltos de línea en este ejemplo para que se ajuste a la página.
Las secciones siguientes enumeran y definen los elementos de su CDF nombre de archivo.
Un típico CDF file name contiene los elementos que se enumeran a continuación. Nota, cursiva indica un marcador de posición variable:
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
En su S3 , los archivos se ordenan en orden ascendente por ID de socio (PID), día y hora.
En la tabla siguiente se enumeran y definen los elementos de una CDF nombre de archivo.
Elemento Nombre de archivo | Descripción |
---|---|
|
Este es el espacio de almacenamiento raíz predeterminado para su archivo CDF en un servidor Amazon S3. |
|
Nombre del contenedor S3 de solo lectura que contiene los archivos CDF. |
|
La fecha en la que se procesó el archivo. |
|
Un valor de hora expresado en notación de 24 horas y establecido en la zona horaria UTC. Consulte también. Fuentes de datos del cliente Nombre de archivo Horas y Contenido de archivo Horas.... |
|
Su ID de socio. |
|
Valores que identifican la secuencia de archivos. La secuencia se incrementa de la siguiente manera: 0_0_0 , 0_1_0, 0_2_0....1_0_0 |
|
Extensión de archivo gzip. Los archivos CDF están comprimidos en gzip. |
Audience Manager escribe un .info
archivo a su S3 directorio para que sepa cuándo Customer Data File (CDF) está listo para descargar. El .info
el archivo también incluye JSON metadatos con formato sobre el contenido de su CDF archivos. Revise esta sección para obtener información sobre la sintaxis y los campos utilizados por este archivo de notificación.
Cada .info
el archivo contiene un Files
y Totals
sección. El Files
contiene una matriz que contiene métricas específicas para cada archivo por hora. El Totals
contiene métricas agregadas en todas sus CDF archivos de un día en particular. El contenido de su .info
podría ser similar al siguiente ejemplo.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Las siguientes tablas enumeran y definen los elementos de una CDF .info
archivo.
Campo | Descripción |
---|---|
|
Inicia la matriz que contiene metadatos sobre los archivos CDF. |
|
Tamaño de archivo en bytes. |
|
La Amazon S3 ETag. El número que sigue al guión muestra el número de partes utilizadas para crear el archivo durante la carga de varias partes. El |
|
El nombre del archivo. Consulte Convenciones sobre nombres de archivos en fuentes de datos de clientes. |
|
Un número de índice para cada archivo. |
Campo | Descripción |
---|---|
|
Inicia el objeto que contiene los datos agregados de todos los archivos CDF. |
|
El día para el cual los datos están disponibles. Usos aaaa-mm-dd formato. |
|
La hora para la que los datos están disponibles. Utiliza el formato de 24 horas establecido en la zona horaria UTC. |
|
Tamaño total de todos los archivos CDF para esa fecha en bytes. |
|
Número total de archivos cargados en el directorio S3. |
Su CDF el archivo contiene marcas de hora en su nombre y contenido. Estas marcas de tiempo registran diferentes procesos de evento para el mismo CDF archivo. No es raro ver marcas de tiempo diferentes en el nombre y el contenido del mismo archivo. Comprender cada marca de tiempo puede ayudarle a evitar errores comunes al trabajar con estos datos o al intentar ordenarlos por tiempo.
CDF Los archivos registran el tiempo de forma diferente en dos ubicaciones independientes.
La siguiente tabla proporciona detalles adicionales sobre su CDF las marcas de tiempo de los archivos, junto con información sobre cómo utilizarlas correctamente.
Ubicación de marca de tiempo | Descripción |
---|---|
Nombre del archivo | La marca de tiempo de su CDF nombre de archivo marca la hora en que Audience Manager comenzó a preparar el archivo para su envío. Esta marca de tiempo se establece en UTC zona horaria. Utiliza el hour= , con el formato de hora de 2 dígitos en notación de 24 horas. Esta hora puede ser diferente a la hora del evento registrada en el contenido del archivo. Al trabajar con CDF archivos, a veces notará que su S3 el bloque está vacío durante una hora en particular. Un bloque vacío significa que puede significar cualquiera de las siguientes opciones:
Importante: no utilice la marca de tiempo del nombre de archivo para agrupar eventos por tiempo. Si necesita agrupar por tiempo, utilice el EventTime marca de tiempo en el contenido del archivo. |
Contenido de archivo | La marca de tiempo de su CDF el contenido del archivo marca la hora en que Data Collection Servers comenzó a procesar el archivo. Esta marca de tiempo se establece en UTC zona horaria. Utiliza el EventTime , con el formato de hora yyyy-mm-dd hh:mm:ss . Esta hora está cerca de la hora real del evento en la página, pero puede ser diferente al indicador de hora del nombre del archivo. Sugerencia: A diferencia del hour= marca de tiempo en el nombre del archivo, puede utilizar EventTime para agrupar los datos por tiempo. |