Customer Data Feeds

Información básica sobre archivos Customer Data Feed (CDF) e instrucciones sobre cómo empezar. Comience aquí si está interesado en recibir archivos CDF o solo desea más información.

Contenido del archivo y propósito

Un archivo CDF contiene los mismos datos que una llamada de evento de Audience Manager (/event) envía a nuestros servidores. Esto incluye datos como ID de usuario, trait IDs, segment IDs y todos los demás parámetros capturados por una llamada de evento. Los sistemas internos Audience Manager procesan los datos de evento en un archivo CDF con contenido organizado en campos que aparecen en un orden establecido. Audience Manager intenta generar CDF archivos cada hora y los almacena en un bloque seguro específico del cliente en un Amazon S3 servidor. Proporcionamos estos archivos para que pueda trabajar con datos Audience Manager fuera de los límites impuestos por nuestra interfaz de usuario.

IMPORTANTE

Tenga en cuenta las restricciones siguientes al trabajar con archivos CDF:

  • Antes de configurar la entrega de archivos CDF, asegúrese de que tiene los permisos adecuados de proveedores de datos de terceros para la exportación de características de terceros. Actualmente, el Audience Manager no admite la funcionalidad en la interfaz de usuario para solicitar el permiso de exportación de envío de archivos CDF de proveedores de datos de terceros, por lo que debe ponerse en contacto con ellos de forma independiente.
  • No debe utilizar CDF archivos como proxy para supervisar el tráfico de la página, reconciliar discrepancias en los informes, o para la facturación, etc.

Introducción

No hay ningún proceso de autoservicio para iniciar la entrega de archivos CDF. Póngase en contacto con su asesor de Audience Manager o con el Servicio de atención al cliente para empezar. Durante la implementación, su representante de Audience Manager:

  • Configure su espacio de almacenamiento Amazon S3.
  • Proporcione credenciales de autenticación S3 de solo lectura al espacio de almacenamiento de archivos. No podrá ver ni acceder a directorios y archivos que pertenezcan a otros clientes.

Las notificaciones de archivos y los archivos CDF aparecerán en el bloque S3 cuando estén listos para la descarga. Usted es el responsable de supervisar y descargar archivos del directorio S3 asignado. Consulte Notificaciones sobre procesamiento de archivos de fuentes de datos de clientes.

Pasos siguientes

Las secciones siguientes y las Preguntas frecuentes sobre la fuente de datos del cliente pueden ayudarle a familiarizarse con este servicio.

Customer Data Feed Contenido definido

Enumera y define los elementos de datos y las matrices de un archivo CDF por orden de aspecto. Las definiciones incluyen tipos de datos, pero esta información no forma parte de un archivo CDF.

Definiciones

Un archivo CDF incluye algunos o todos los campos definidos a continuación. Para obtener información sobre la organización de archivos internos, consulte Estructura de archivos de fuentes de datos de clientes.

Campo Tipo de datos Descripción

Event Time

Marca de tiempo

La hora en que los Servidores de recopilación de datos (DCS) procesaron un archivo CDF. La marca de tiempo utiliza el formato yyyy-mm-dd hh:mm:ss y se establece en la zona horaria UTC.

Nota: El Tiempo de evento no es:

Device

Cadena

Este es el ID de usuario único (UUID), que es un ID de dispositivo de 38 dígitos para el visitante del sitio. Consulte también Índice de ID en Audience Manager.

Container ID

Numérica

ID del contenedor que activa la sincronización de ID.

Realized Traits

Matriz numérica

Matriz de ID de rasgos que contiene todos los rasgos que un visitante realizó (para los que se calificó) en la llamada de evento.

Tenga en cuenta que la matriz puede contener rasgos para los que el visitante se haya clasificado antes y para los que se vuelve a calificar mediante esta llamada de evento.

Realized Segments

Matriz numérica

Matriz de ID de segmento que contiene todos los segmentos que realizó un visitante (para los que cumple los requisitos) en la llamada de evento.

Request Parameters

Cadena

Una cadena que captura todos los parámetros (variables, ID, pares de clave-valor, ID de publicidad de dispositivo, etc.) se transfiere en la llamada de evento.

Ejemplo abreviado:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type

Cadena

La dirección URL no codificada de la página de referencia (si existe).

IP Data Type

Cadena

La dirección IP del visitante capturada en la llamada de evento.

MCDevice

Cadena

El ID de Experience Cloud (MID) asignado al visitante del sitio. Consulte también la información relativa a las cookies y el servicio de identidad del Experience Platform de Adobe.

All Segments

Matriz numérica

Matriz de ID de segmento que contiene segmentos realizados anteriormente y segmentos nuevos para los que el visitante está cualificado.

All Traits

Matriz numérica

Matriz de ID de rasgos de origen y de terceros que contiene características realizadas anteriormente y nuevas características para las que el visitante ha calificado desde la última fuente de datos generada.

Customer Data Feed Estructura del archivo

Enumera y define la estructura de datos de un archivo CDF. Esto incluye secuencia de datos, delimitadores y separadores de campos, un mapa de archivos de datos y un archivo de muestra.

Identificadores y secuencia de campos de datos

CDF los archivos no contienen columnas etiquetadas ni encabezados de campo. En su lugar, un archivo CDF define campos y matrices con caracteres no imprimibles ASCII. Además, el archivo CDF enumera cada campo y matriz en un orden específico. La comprensión de los identificadores de campo y el orden le ayudará a analizar el archivo correctamente.

Elemento Archivo CDF Descripción

Separadores y delimitadores de campo

Estos caracteres no imprimibles definen los elementos y la estructura del archivo CDF:

  • Ctrl + a (ASCII 001 o ^A) separa los datos de campos individuales con un indicador de espacio no imprimible.
  • Ctrl + b (ASCII 002 o ^B) separa los datos, la matriz y los parámetros de solicitud.
  • Ctrl + c (ASCII 003 o ^C) define pares clave-valor.

Secuencia de campo

Importante: El Audience Manager se reserva el derecho de agregar nuevos campos al final del archivo CDF en futuras versiones. Esto significa que el diseño técnico del sistema de análisis de archivos no debe asumir un número fijo de columnas (aunque puede suponer un orden fijo para las columnas existentes).

Los datos del archivo CDF aparecen en el orden que se muestra a continuación.

  1. Hora del evento
  2. Device
  3. ID de contenedor
  4. Rasgos reales
  5. Segmentos hechos
  6. Parámetros de solicitud
  7. Referer
  8. Dirección IP
  9. ID del dispositivo Experience Cloud (o MID). Consulte también la información relativa a las cookies y el servicio de identidad de Adobe Experience Platform
  10. Todos los segmentos
  11. Todos los rasgos

Para obtener descripciones de los campos, consulte Contenido definido de la fuente de datos del cliente.

CDF Mapa del archivo

CDF los datos del archivo aparecen en el orden que se muestra a continuación.

Identificación de matrices

Las matrices de un archivo CDF comienzan y finalizan con el separador de campos Ctrl + a. Esto hace que el primer elemento de una matriz aparezca como un campo de datos independiente. Por ejemplo, la matriz traits realizada comienza con ^A1234. El delimitador de matriz y el ID ^B5678 siguen esta entrada. Como resultado, es posible que esté tentado a pensar que el primer elemento de la matriz traits realizada es el ID 5678 (porque comienza con ^B). Este no es el caso, por lo que debe estar familiarizado con la secuencia y la estructura de un archivo de datos. Aunque el primer elemento de la matriz trait existente (o cualquiera de las otras matrices de un archivo CDF) comience por ^A, el orden de aspecto o posición del archivo define el inicio de una matriz. Además, el primer elemento de una matriz siempre se separa de la entrada anterior por ^A.

Archivo CDF de muestra

Un archivo CDF de muestra podría tener un aspecto similar al siguiente. Hemos insertado saltos de línea en este ejemplo para ayudarle a ajustar la página.

Customer Data Feed Convenciones de nomenclatura de archivos

Las secciones siguientes enumeran y definen los elementos en su nombre de archivo CDF.

CDF Nombre del archivo: Sintaxis y ejemplo

Un nombre de archivo CDF típico contiene los elementos que se enumeran a continuación. Tenga en cuenta que cursiva indica un marcador de posición de variable:

Sintaxis

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF-PARTNER-ID-AAM PROCESS-ID_0.gz

Ejemplo

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_000058_0.gz

En el espacio de almacenamiento S3, los archivos se ordenan en orden ascendente por ID de socio (PID), día y hora.

CDF Elementos de nombre de archivo definidos

En la tabla siguiente se enumeran y definen los elementos de un nombre de archivo CDF.

Elemento Nombre de archivo Descripción

s3://aam-cdf/

Este es el espacio de almacenamiento raíz predeterminado para su archivo CDF en un servidor Amazon S3.

your S3 bucket name

El nombre del contenedor S3 de solo lectura que contiene sus archivos CDF.

day=yyyy-mm-dd

La fecha en la que se procesó el archivo.

hour=hh

Un valor de hora expresado en notación de 24 horas y establecido en la zona horaria UTC. Consulte también Tiempos del nombre de archivo de la fuente de datos del cliente y Tiempos de contenido del archivo....

partner ID

Su ID de socio.

AAM process ID_0

Un ID de proceso Audience Manager interno.

.gz

Extensión de archivo gzip. Los archivos CDF están comprimidos en gzip.

Customer Data Feed Notificaciones de procesamiento de archivos

Audience Manager escribe un .info archivo en su S3 directorio para informarle cuando su Customer Data File (CDF) esté listo para la descarga. El archivo .info también incluye metadatos con formato JSON sobre el contenido de sus archivos CDF. Consulte esta sección para obtener información sobre la sintaxis y los campos utilizados por este archivo de notificación.

Archivo de información de muestra

Cada archivo .info contiene una sección Files y Totals. La sección Files contiene una matriz que contiene métricas específicas para cada archivo por hora. La sección Totals contiene métricas agregadas en todos los archivos CDF de un día en particular. El contenido del archivo .info puede tener un aspecto similar al del siguiente ejemplo.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Campos del archivo de información definidos

Las siguientes tablas enumeran y definen los elementos de un archivo CDF .info.

Objeto Files

Campo Descripción

Files

Inicia la matriz que contiene metadatos sobre los archivos CDF.

FileByteSize

Tamaño del archivo en bytes.

FileChecksumMD5

Amazon S3 ETag. El número que sigue al guión muestra el número de partes utilizadas para crear el archivo durante la carga multiparte. El ETag no es idéntico a la suma de comprobación MD5 del archivo.

FileName

El nombre del archivo. Consulte Convenciones de nomenclatura de archivos de fuentes de datos de clientes.

FileSequenceNumber

Un número de índice para cada archivo.

Objeto Totals

Campo Descripción

Totals

Inicia el objeto que contiene datos acumulados sobre todos los archivos CDF.

Day

El día durante el cual están disponibles los datos. Utiliza el formato yyyy-mm-dd .

Hour

Hora a la que están disponibles los datos. Utiliza el formato de 24 horas configurado en la zona horaria UTC.

TotalByteSize

Tamaño total de todos sus archivos CDF para esa fecha en bytes.

TotalNumberFiles

Número total de archivos cargados en el directorio S3.

Customer Data Feed Los tiempos de los nombres de archivo y los tiempos de contenido de archivo son diferentes

El archivo CDF contiene marcas de hora en el nombre del archivo y en el contenido del archivo. Estas marcas de tiempo registran diferentes procesos de evento para el mismo archivo CDF. No es raro ver diferentes marcas de tiempo en el nombre y contenido del mismo archivo. Comprender cada marca de tiempo puede ayudarle a evitar errores comunes al trabajar con estos datos o al intentar ordenarlos por tiempo.

Localización de CDF Marcas de hora de archivo

CDF los archivos registran el tiempo de forma diferente en dos ubicaciones independientes.

Explicación de la diferencia entre marcas de hora

La siguiente tabla proporciona detalles adicionales sobre las marcas de tiempo del archivo CDF junto con información sobre cómo utilizarlas correctamente.

Ubicación de la marca de tiempo Descripción
Nombre del archivo La marca de tiempo del nombre del archivo CDF marca la hora en que Audience Manager comenzó a preparar el archivo para su envío. Esta marca de tiempo se establece en el huso horario UTC. Utiliza el parámetro hour=, con el formato de hora de 2 dígitos en notación de 24 horas. Esta vez puede ser diferente a la hora del evento registrada en el contenido del archivo. Al trabajar con archivos CDF, a veces notará que su contenedor S3 está vacío durante una hora en particular. Un espacio vacío significa que puede ser cualquiera de los siguientes:
  • No hay datos para esa hora en particular.
  • Nuestros servidores están bajo cargas pesadas y no pueden procesar archivos durante una hora en particular. Cuando el servidor se pone al día, coloca los archivos que deberían haber pasado en archivos de bloque de tiempo anteriores en un bloque con un valor de tiempo posterior. Por ejemplo, verá esto cuando un archivo que debería estar en el bloque de la hora 17 aparezca en el bloque de la hora 18 (con hour=18 en el nombre del archivo). En este caso, el servidor probablemente comenzó a procesar su archivo en la hora 17, pero no pudo completarlo en ese intervalo de tiempo. En su lugar, el archivo se inserta en el siguiente espacio de tiempo por hora.

Importante: No utilice la marca de tiempo del nombre del archivo para agrupar eventos por tiempo. Si necesita agrupar por tiempo, use la marca de tiempo EventTime en el contenido del archivo.
Contenido del archivo La marca de tiempo del contenido del archivo CDF marca la hora en que Data Collection Servers comenzó a procesar el archivo. Esta marca de tiempo se establece en el huso horario UTC. Utiliza el campo EventTime, con el formato de tiempo yyyy-mm-dd hh:mm:ss. Esta hora está cerca de la hora real del evento en la página, pero puede ser diferente del indicador de hora del nombre del archivo.
Sugerencia: A diferencia de la hour= marca de tiempo del nombre del archivo, puede utilizar EventTime para agrupar los datos por hora.

En esta página