Customer Data Feeds

Última actualización: 2023-05-20

Información básica sobre Customer Data Feed (CDF) archivos e instrucciones sobre cómo empezar. Comience aquí si está interesado en recibir CDF archivos o simplemente desea obtener más información.

Contenido y propósito del archivo

Un archivo CDF contiene los mismos datos que una llamada de evento de Audience Manager (/event) envía a nuestros servidores. Esto incluye datos como ID de usuario, trait IDs, segment IDsy todos los demás parámetros capturados por una llamada de evento. Interno Audience Manager procesa los datos de evento en una CDF archivo con contenido organizado en campos que aparecen en un orden definido. Audience Manager intenta generar CDF archivos por hora y los almacena en un espacio seguro y específico del cliente en un Amazon S3 servidor. Proporcionamos estos archivos para que pueda trabajar con Audience Manager datos fuera de los límites impuestos por nuestra interfaz de usuario.

IMPORTANTE

Tenga en cuenta las siguientes restricciones al trabajar con archivos CDF:

  • Antes de configurar la entrega de archivos CDF, asegúrese de que dispone de los permisos adecuados de los proveedores de datos de terceros para la exportación de características de terceros. Actualmente, Audience Manager no admite la funcionalidad en la interfaz de usuario para solicitar a los proveedores de datos de terceros el permiso de exportación de entrega de archivos CDF, por lo que debe ponerse en contacto con ellos de forma independiente.
  • No debe utilizar CDF archivos como proxy para controlar el tráfico de la página, reconciliar discrepancias de informes, o para facturación, etc.

Introducción

No hay ningún proceso de autoservicio para iniciar CDF envío de archivos. Póngase en contacto con su Audience Manager consultor o con el Servicio de atención al cliente para empezar. Durante la implementación, su Audience Manager el representante:

  • Configure su Amazon S3 cubo de almacenamiento.
  • Proporcionar solo lectura S3 credenciales de autenticación en el contenedor de almacenamiento de archivos. No podrá ver ni acceder a directorios y archivos que pertenezcan a otros clientes.

Notificaciones de archivos y CDF Los archivos aparecerán en su S3 cubos cuando estén listos para descargar. Usted es responsable de supervisar y descargar archivos de su asignado S3 directorio. Consulte Notificaciones sobre procesamiento de archivos de fuentes de datos de clientes.

Pasos siguientes

Las secciones siguientes y la Preguntas frecuentes sobre fuentes de datos de clientes puede ayudarle a familiarizarse con este servicio.

Customer Data Feed Contenido definido

Enumera y define los elementos de datos y las matrices de una CDF archivo, por orden de aparición. Las definiciones incluyen tipos de datos, pero esta información no forma parte de un CDF archivo.

IMPORTANTE

Los píxeles de evento se excluyen de forma predeterminada en las configuraciones de CDF. Asegúrese de especificar en la solicitud al servicio de atención al cliente si desea que los píxeles de evento se incluyan en los archivos CDF. Cada píxel de evento se rellenará como una fila única en los archivos CDF.

Definiciones

A CDF incluye algunos o todos los campos definidos a continuación. Para obtener información sobre la organización interna de archivos, consulte Estructura de archivo de fuente de datos del cliente.

Campo Tipo de datos Descripción

Event Time

Marca de tiempo

Hora a la que el administrador procesó un archivo CDF Servidores de recopilación de datos (DCS). La marca de tiempo utiliza el yyyy-mm-dd hh:mm:ss y se establece en la zona horaria UTC.

Nota: La Hora Del Evento no es:

Device

Cadena

Este es el ID de usuario único (UUID), que es un ID de dispositivo de 38 dígitos para el visitante del sitio. Consulte también Índice de ID en Audience Manager.

Container ID

Numérica

El ID del contenedor que activa la sincronización de ID. Este campo solo se rellena si establece el ID de contenedor en la variable d_nsid dentro de la implementación del sitio. De lo contrario, el valor predeterminado de 0 no se incluirá en los archivos CDF.

Realized Traits

Matriz numérica

Una matriz de ID de rasgos que contiene todos los rasgos para los que un visitante se dio cuenta (cualificado) en la llamada de evento.

Tenga en cuenta que la matriz puede contener características para las que el visitante había cumplido los requisitos antes y para las que volvió a clasificarse a través de esta llamada de evento.

Realized Segments

Matriz numérica

Matriz de ID de segmento que contiene todos los segmentos para los que el visitante se dio cuenta (para los que cumple los requisitos) en la llamada de evento.

Request Parameters

Cadena

Una cadena que captura todos los parámetros (variables, ID, pares clave-valor, ID de publicidad de dispositivo, etc.) pasado en la llamada de evento.

Ejemplo abreviado:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type

Cadena

La dirección URL sin codificar de la página de referencia (si la hay).

IP Data Type

Cadena

La dirección IP del visitante capturada en la llamada de evento.

MCDevice

Cadena

El Experience Cloud ID asignado al visitante del sitio. Consulte también. Cookies y el servicio de ID del Experience Platform de Adobe.

All Segments

Matriz numérica

Matriz de ID de segmento que contiene segmentos para los que se ha realizado anteriormente y nuevos segmentos para los que el visitante está cualificado.

All Traits

Matriz numérica

Una matriz de ID de rasgos de origen y de terceros que contiene rasgos realizados anteriormente y nuevos rasgos para los que el visitante ha cumplido los requisitos desde la última fuente de datos generada.

Customer Data Feed Estructura de archivos

Enumera y define la estructura de datos de un CDF archivo. Esto incluye la secuencia de datos, los delimitadores y separadores de campo, un mapa del archivo de datos y un archivo de muestra.

Identificadores y secuencia de campos de datos

CDF los archivos no contienen columnas etiquetadas ni encabezados de campo. En su lugar, un CDF define campos y matrices con elementos no imprimibles ASCII caracteres. Además, la variable CDF El archivo enumera cada campo y matriz en un orden específico. Comprender los identificadores de campo y el orden le ayudará a analizar el archivo correctamente.

Elemento de archivo CDF Descripción

Separadores y delimitadores de campos

Estos caracteres no imprimibles definen los elementos y la estructura del archivo CDF:

  • Ctrl + a (ASCII) 001 o ^A) separa los datos de campos individuales con un indicador de espacio no imprimible.
  • Ctrl + b (ASCII) 002 o ^B) separa los datos de una matriz y los parámetros de solicitud.
  • Ctrl + c (ASCII) 003 o ^C) define pares clave-valor.

Secuencia de campos

Importante: Audience Manager se reserva el derecho de añadir nuevos campos al final del archivo CDF en futuras versiones. Esto significa que el diseño técnico del sistema de análisis de archivos no debe suponer un número fijo de columnas (aunque puede suponer un orden fijo para las columnas existentes).

Los datos del archivo CDF aparecen en el orden indicado a continuación. /N puede aparecer en lugar de cualquiera de estos campos, lo que indica un valor nulo.

  1. Hora del evento
  2. Device
  3. ID de contenedor
  4. Características realizadas
  5. Segmentos realizados
  6. Parámetros de solicitud
  7. Referer
  8. Dirección IP
  9. ID del dispositivo del Experience Cloud (o MID). Consulte también. Cookies y el servicio de Adobe Experience Platform ID
  10. Todos los segmentos
  11. Todas las características

Para ver las descripciones de los campos, consulte Contenido de fuente de datos de cliente definido.

CDF Mapa de archivos

CDF los datos del archivo aparecen en el orden mostrado a continuación.

Identificación de matrices

Matrices en una CDF inicio y final del archivo con Ctrl + a separador de campos. Esto hace que el primer elemento de una matriz parezca un campo de datos independiente. Por ejemplo, la cuenta traits la matriz empieza por ^A1234. El delimitador de matriz y el ID ^B5678 sigue esta entrada. Como resultado, puede sentirse tentado a pensar que el primer elemento de la imagen realizada traits La matriz es el ID 5678 (porque comienza con ^B). Este no es el caso, por lo que debe estar familiarizado con la secuencia y estructura de un archivo de datos. A pesar de que el primer elemento en el realizado trait matriz (o cualquiera de las otras matrices de una CDF file) empieza por ^A, el orden de aparición o posición en el archivo define el inicio de una matriz. Y, el primer elemento de una matriz siempre se separa de la entrada anterior por ^A.

Muestra CDF Archivo

Una muestra CDF podría tener un aspecto similar al siguiente. Hemos insertado saltos de línea en este ejemplo para que se ajuste a la página.

Customer Data Feed Convenciones de nomenclatura de archivos

Las secciones siguientes enumeran y definen los elementos de su CDF nombre de archivo.

CDF Nombre del archivo: sintaxis y ejemplo

Un típico CDF file name contiene los elementos que se enumeran a continuación. Nota, cursiva indica un marcador de posición variable:

Sintaxis

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Ejemplo

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

En su S3 , los archivos se ordenan en orden ascendente por ID de socio (PID), día y hora.

CDF Elementos de nombre de archivo definidos

En la tabla siguiente se enumeran y definen los elementos de una CDF nombre de archivo.

Elemento Nombre de archivo Descripción

s3://aam-cdf/

Este es el espacio de almacenamiento raíz predeterminado para su archivo CDF en un servidor Amazon S3.

your S3 bucket name

Nombre del contenedor S3 de solo lectura que contiene los archivos CDF.

day=yyyy-mm-dd

La fecha en la que se procesó el archivo.

hour=hh

Un valor de hora expresado en notación de 24 horas y establecido en la zona horaria UTC. Consulte también. Fuentes de datos del cliente Nombre de archivo Horas y Contenido de archivo Horas....

partner ID

Su ID de socio.

File Sequence_0

Valores que identifican la secuencia de archivos. La secuencia se incrementa de la siguiente manera: 0_0_0 , 0_1_0, 0_2_0....1_0_0

.gz

Extensión de archivo gzip. Los archivos CDF están comprimidos en gzip.

Customer Data Feed Notificaciones de procesamiento de archivos

Audience Manager escribe un .info archivo a su S3 directorio para que sepa cuándo Customer Data File (CDF) está listo para descargar. El .info el archivo también incluye JSON metadatos con formato sobre el contenido de su CDF archivos. Revise esta sección para obtener información sobre la sintaxis y los campos utilizados por este archivo de notificación.

Archivo de información de muestra

Cada .info el archivo contiene un Files y Totals sección. El Files contiene una matriz que contiene métricas específicas para cada archivo por hora. El Totals contiene métricas agregadas en todas sus CDF archivos de un día en particular. El contenido de su .info podría ser similar al siguiente ejemplo.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Campos de archivo de información definidos

Las siguientes tablas enumeran y definen los elementos de una CDF .info archivo.

Objeto Files

Campo Descripción

Files

Inicia la matriz que contiene metadatos sobre los archivos CDF.

FileByteSize

Tamaño de archivo en bytes.

FileChecksumMD5

La Amazon S3 ETag. El número que sigue al guión muestra el número de partes utilizadas para crear el archivo durante la carga de varias partes. El ETag no es idéntico a la suma de comprobación MD5 del archivo.

FileName

El nombre del archivo. Consulte Convenciones sobre nombres de archivos en fuentes de datos de clientes.

FileSequenceNumber

Un número de índice para cada archivo.

Objeto Totals

Campo Descripción

Totals

Inicia el objeto que contiene los datos agregados de todos los archivos CDF.

Day

El día para el cual los datos están disponibles. Usos aaaa-mm-dd formato.

Hour

La hora para la que los datos están disponibles. Utiliza el formato de 24 horas establecido en la zona horaria UTC.

TotalByteSize

Tamaño total de todos los archivos CDF para esa fecha en bytes.

TotalNumberFiles

Número total de archivos cargados en el directorio S3.

Customer Data Feed Las horas del nombre del archivo y las horas del contenido del archivo son diferentes

Su CDF el archivo contiene marcas de hora en su nombre y contenido. Estas marcas de tiempo registran diferentes procesos de evento para el mismo CDF archivo. No es raro ver marcas de tiempo diferentes en el nombre y el contenido del mismo archivo. Comprender cada marca de tiempo puede ayudarle a evitar errores comunes al trabajar con estos datos o al intentar ordenarlos por tiempo.

Localización CDF Marcas horarias de archivo

CDF Los archivos registran el tiempo de forma diferente en dos ubicaciones independientes.

Explicación de la diferencia entre marcas de tiempo

La siguiente tabla proporciona detalles adicionales sobre su CDF las marcas de tiempo de los archivos, junto con información sobre cómo utilizarlas correctamente.

Ubicación de marca de tiempo Descripción
Nombre del archivo La marca de tiempo de su CDF nombre de archivo marca la hora en que Audience Manager comenzó a preparar el archivo para su envío. Esta marca de tiempo se establece en UTC zona horaria. Utiliza el hour= , con el formato de hora de 2 dígitos en notación de 24 horas. Esta hora puede ser diferente a la hora del evento registrada en el contenido del archivo. Al trabajar con CDF archivos, a veces notará que su S3 el bloque está vacío durante una hora en particular. Un bloque vacío significa que puede significar cualquiera de las siguientes opciones:
  • No hay datos para esa hora en particular.
  • Nuestros servidores están bajo cargas pesadas y no pueden procesar archivos durante una hora en particular. Cuando el servidor se pone al día, coloca los archivos que deberían haber estado en un bloque de tiempo anterior en un bloque con un valor de tiempo posterior. Por ejemplo, verá esto cuando aparezca un archivo que debería haber estado en el bloque de horas 17 en el bloque de horas 18 (con hour=18 en el nombre del archivo). En este caso, es probable que el servidor haya empezado a procesar el archivo en la hora 17, pero no haya podido completarlo en ese intervalo de tiempo. En su lugar, el archivo se inserta en el siguiente bloque de tiempo por hora.

Importante: no utilice la marca de tiempo del nombre de archivo para agrupar eventos por tiempo. Si necesita agrupar por tiempo, utilice el EventTime marca de tiempo en el contenido del archivo.
Contenido de archivo La marca de tiempo de su CDF el contenido del archivo marca la hora en que Data Collection Servers comenzó a procesar el archivo. Esta marca de tiempo se establece en UTC zona horaria. Utiliza el EventTime , con el formato de hora yyyy-mm-dd hh:mm:ss. Esta hora está cerca de la hora real del evento en la página, pero puede ser diferente al indicador de hora del nombre del archivo.
Sugerencia: A diferencia del hour= marca de tiempo en el nombre del archivo, puede utilizar EventTime para agrupar los datos por tiempo.

En esta página