Información básica sobre Customer Data Feed (CDF) archivos e instrucciones sobre cómo empezar. Comience aquí si está interesado en recibir CDF o solo desea más información.
Un archivo CDF contiene los mismos datos que una llamada de evento de Audience Manager (/event
) envía a nuestros servidores. Esto incluye datos como los ID de usuario, trait IDs, segment IDsy todos los demás parámetros capturados por una llamada de evento. Internas Audience Manager los sistemas procesan los datos de evento en un CDF archivo con contenido organizado en campos que aparecen en un orden definido. Audience Manager intenta generar CDF archivos por hora y los almacena en un bloque seguro y específico para el cliente en un Amazon S3 servidor. Proporcionamos estos archivos para que pueda trabajar con Audience Manager datos fuera de los límites impuestos por nuestra interfaz de usuario.
Tenga en cuenta las restricciones siguientes al trabajar con archivos CDF:
No hay ningún proceso de autoservicio que iniciar CDF entrega de archivos. Póngase en contacto con su Audience Manager para empezar. Durante la implementación, su Audience Manager representante:
Notificaciones de archivos y CDF los archivos aparecerán en su S3 cuando estén listos para la descarga. Usted es el responsable de supervisar y descargar los archivos de su S3 directorio. Consulte Notificaciones sobre procesamiento de archivos de fuentes de datos de clientes.
Las secciones siguientes y la Preguntas frecuentes sobre la Fuente de datos de clientes puede ayudarle a familiarizarse con este servicio.
Enumera y define los elementos de datos y las matrices en una CDF por orden de aspecto. Las definiciones incluyen tipos de datos, pero esta información no forma parte de un CDF archivo.
Los píxeles de evento se excluyen de forma predeterminada en las configuraciones de CDF. Asegúrese de especificar en la solicitud al servicio de atención al cliente si desea que los píxeles de evento se incluyan en los archivos CDF. Cada píxel de evento se rellenará como una fila única en los archivos CDF.
A CDF incluye algunos o todos los campos definidos a continuación. Para obtener información sobre la organización de archivos internos, consulte Estructura del archivo de la fuente de datos del cliente.
Campo | Tipo de datos | Descripción |
---|---|---|
|
Marca de tiempo |
La hora en la que procesó un archivo CDF el Servidores de recopilación de datos (DCS). La marca de tiempo utiliza la variable aaaa-mm-dd hh:mm:ss y se establece en la zona horaria UTC.
Nota: La hora del evento no es:
|
|
Cadena |
Esta es la ID de usuario único (UUID), que es un ID de dispositivo de 38 dígitos para el visitante del sitio. Consulte también Índice de ID en Audience Manager. |
|
Numérica |
ID del contenedor que activa la sincronización de ID. Este campo solo se rellena si establece el ID de contenedor en la variable d_nsid dentro de la implementación del sitio. De lo contrario, el valor predeterminado de 0 no se incluirá en los archivos CDF. |
|
Matriz numérica |
Matriz de ID de rasgos que contiene todos los rasgos que un visitante realizó (para los que se calificó) en la llamada de evento. Tenga en cuenta que la matriz puede contener rasgos para los que el visitante se haya clasificado antes y para los que se vuelve a calificar mediante esta llamada de evento. |
|
Matriz numérica |
Matriz de ID de segmento que contiene todos los segmentos que realizó un visitante (para los que cumple los requisitos) en la llamada de evento. |
|
Cadena |
Una cadena que captura todos los parámetros (variables, ID, pares de clave-valor, ID de publicidad de dispositivo, etc.) se transfiere en la llamada de evento. Ejemplo abreviado: |
|
Cadena |
La dirección URL no codificada de la página de referencia (si existe). |
|
Cadena |
La dirección IP del visitante capturada en la llamada de evento. |
|
Cadena |
La variable Experience Cloud ID (MID) asignado al visitante del sitio. Consulte también Cookies y el servicio de identidad de Adobe Experience Platform. |
|
Matriz numérica |
Matriz de ID de segmento que contiene segmentos realizados anteriormente y segmentos nuevos para los que el visitante está cualificado. |
|
Matriz numérica |
Matriz de ID de rasgos de origen y de terceros que contiene características realizadas anteriormente y nuevas características para las que el visitante ha calificado desde la última fuente de datos generada. |
Enumera y define la estructura de datos de un CDF archivo. Esto incluye secuencia de datos, delimitadores y separadores de campos, un mapa de archivos de datos y un archivo de muestra.
CDF los archivos no contienen columnas etiquetadas ni encabezados de campo. En su lugar, una CDF define campos y matrices con no impresión ASCII caracteres. Además, el CDF enumera cada campo y matriz en un orden específico. La comprensión de los identificadores de campo y el orden le ayudará a analizar el archivo correctamente.
Elemento Archivo CDF | Descripción |
---|---|
Separadores y delimitadores de campo |
Estos caracteres no imprimibles definen los elementos y la estructura del archivo CDF:
|
Secuencia de campo |
Importante: Audience Manager se reserva el derecho de añadir nuevos campos al final del archivo CDF en futuras versiones. Esto significa que el diseño técnico del sistema de análisis de archivos no debe asumir un número fijo de columnas (aunque puede suponer un orden fijo para las columnas existentes). Los datos del archivo CDF aparecen en el orden que se muestra a continuación. /N puede aparecer en lugar de cualquiera de estos campos, indicando un valor nulo.
Para obtener descripciones de los campos, consulte Contenido de la fuente de datos del cliente definido. |
CDF los datos del archivo aparecen en el orden que se muestra a continuación.
Matrices en una CDF inicio y finalización del archivo con la variable Ctrl + a
separador de campos. Esto hace que el primer elemento de una matriz aparezca como un campo de datos independiente. Por ejemplo, el valor traits la matriz empieza con ^A1234
. El delimitador de matriz y el ID ^B5678
sigue esta entrada. Como resultado, es posible que esté tentado a pensar que el primer elemento de la sección traits matriz es ID 5678 (porque comienza con ^B
). Este no es el caso, por lo que debe estar familiarizado con la secuencia y la estructura de un archivo de datos. Aunque el primer elemento de la trait (o cualquiera de las otras matrices de una CDF file) comienza con ^A
, el orden de aparición o posición en el archivo define el inicio de una matriz. Y, el primer elemento de una matriz siempre se separa de la entrada anterior por ^A
.
Un ejemplo CDF puede tener un aspecto similar al siguiente. Hemos insertado saltos de línea en este ejemplo para ayudarle a ajustar la página.
Las secciones siguientes enumeran y definen los elementos de su CDF nombre del archivo.
Una CDF nombre de archivo contiene los elementos que se enumeran a continuación. Nota: cursiva indica un marcador de posición de variable:
s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz
s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz
En S3 espacio de almacenamiento, los archivos se ordenan en orden ascendente por ID de socio (PID), día y hora.
La tabla siguiente enumera y define los elementos de una CDF nombre del archivo.
Elemento Nombre de archivo | Descripción |
---|---|
|
Este es el espacio de almacenamiento raíz predeterminado para su archivo CDF en un servidor Amazon S3. |
|
El nombre del contenedor S3 de solo lectura que contiene sus archivos CDF. |
|
La fecha en la que se procesó el archivo. |
|
Un valor de hora expresado en notación de 24 horas y establecido en la zona horaria UTC. Consulte también Nombre de archivo de fuente de datos de cliente Tiempos y tiempos de contenido de archivo.... |
|
Su ID de socio. |
|
Valores que identifican la secuencia de archivos. La secuencia aumenta de la siguiente manera: 0_0_0 , 0_1_0, 0_2_0....1_0_0 |
|
Extensión de archivo gzip. Los archivos CDF están comprimidos en gzip. |
Audience Manager escribe un .info
para S3 para que sepa cuándo Customer Data File (CDF) está listo para la descarga. La variable .info
también incluye JSON metadatos con formato sobre el contenido de su CDF archivos. Consulte esta sección para obtener información sobre la sintaxis y los campos utilizados por este archivo de notificación.
Cada .info
contiene un Files
y Totals
para obtener más información. La variable Files
contiene una matriz que contiene métricas específicas para cada archivo por hora. La variable Totals
contiene métricas agregadas en todas las CDF archivos para un día en particular. El contenido de su .info
puede tener un aspecto similar al del siguiente ejemplo.
{
"Files": [
{
"FileByteSize": 2709730,
"FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
"FileName": "AAM_CDF_1109_000000_0.gz",
"FileSequenceNumber": 1
},
{
"FileByteSize": 2783351,
"FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
"FileName": "AAM_CDF_1109_000001_0.gz",
"FileSequenceNumber": 2
}
],
"Totals": {
"Day": "2017-09-26",
"Hour": "18",
"TotalByteSize": 150092997,
"TotalNumberFiles": 2
}
}
Las tablas siguientes enumeran y definen los elementos de una CDF .info
archivo.
Campo | Descripción |
---|---|
|
Inicia la matriz que contiene metadatos sobre los archivos CDF. |
|
Tamaño del archivo en bytes. |
|
Amazon S3 ETag. El número que sigue al guión muestra el número de partes utilizadas para crear el archivo durante la carga multiparte. La variable |
|
El nombre del archivo. Consulte Convenciones de nomenclatura de archivos de la fuente de datos del cliente. |
|
Un número de índice para cada archivo. |
Campo | Descripción |
---|---|
|
Inicia el objeto que contiene datos acumulados sobre todos los archivos CDF. |
|
El día durante el cual están disponibles los datos. Usos aaaa-mm-dd formato. |
|
Hora a la que están disponibles los datos. Utiliza el formato de 24 horas configurado en la zona horaria UTC. |
|
Tamaño total de todos sus archivos CDF para esa fecha en bytes. |
|
Número total de archivos cargados en el directorio S3. |
Su CDF contiene marcas de hora en el nombre del archivo y en el contenido del archivo. Estas marcas de tiempo registran diferentes procesos de eventos para los mismos CDF archivo. No es raro ver diferentes marcas de tiempo en el nombre y contenido del mismo archivo. Comprender cada marca de tiempo puede ayudarle a evitar errores comunes al trabajar con estos datos o al intentar ordenarlos por tiempo.
CDF los archivos registran el tiempo de forma diferente en dos ubicaciones independientes.
La siguiente tabla proporciona detalles adicionales sobre su CDF marcas de hora de archivo junto con información sobre cómo utilizarlas correctamente.
Ubicación de la marca de tiempo | Descripción |
---|---|
Nombre del archivo | La marca de tiempo de su CDF el nombre del archivo marca la hora en la que Audience Manager ha empezado a preparar el archivo para su envío. Esta marca de tiempo se establece en la variable UTC zona horaria. Utiliza el hour= , con el formato de hora de 2 dígitos en notación de 24 horas. Esta vez puede ser diferente a la hora del evento registrada en el contenido del archivo. Al trabajar con CDF , a veces notará que su S3 el contenedor está vacío durante una hora determinada. Un espacio vacío significa que puede ser cualquiera de los siguientes:
Importante: No utilice la marca de tiempo del nombre del archivo para agrupar eventos por tiempo. Si necesita agrupar por tiempo, use la variable EventTime marca de tiempo en el contenido del archivo. |
Contenido del archivo | La marca de tiempo de su CDF El contenido del archivo marca la hora en la que se define la variable Data Collection Servers se ha empezado a procesar el archivo. Esta marca de tiempo se establece en la variable UTC zona horaria. Utiliza el EventTime , con el formato de tiempo yyyy-mm-dd hh:mm:ss . Esta hora está cerca de la hora real del evento en la página, pero puede ser diferente del indicador de hora del nombre del archivo. Sugerencia: A diferencia de hour= marca de tiempo en el nombre del archivo, puede utilizar EventTime para agrupar los datos por hora. |