Customer Data Feeds customer-data-feeds

Información básica sobre Customer Data Feed (CDF) archivos e instrucciones sobre cómo comenzar. Comience aquí si está interesado en recibir CDF archivos o simplemente desea más información.

Contenido y propósito del archivo file-contents-purpose

Un archivo de CDF contiene los mismos datos que una llamada de evento de Audience Manager (/event) envía a nuestros servidores. Esto incluye datos como los identificadores de usuario, trait IDs, segment IDs y todos los demás parámetros capturados por una llamada de evento. Los sistemas internos Audience Manager procesan los datos de evento en un archivo CDF con contenido organizado en campos que aparecen en un orden definido. Audience Manager intenta generar CDF archivos cada hora y los almacena en un contenedor seguro y específico del cliente en un servidor Amazon S3. Proporcionamos estos archivos para que pueda trabajar con datos de Audience Manager fuera de los límites impuestos por nuestra interfaz de usuario.

IMPORTANT
Tenga en cuenta las siguientes restricciones al trabajar con archivos CDF:
  • Antes de configurar la entrega de archivos CDF, asegúrese de que dispone de los permisos adecuados de los proveedores de datos de terceros para la exportación de características de terceros. Actualmente, Audience Manager no admite la funcionalidad en la interfaz de usuario para solicitar a los proveedores de datos de terceros el permiso de exportación de entrega de archivos CDF, por lo que debe ponerse en contacto con ellos de forma independiente.
  • No debe usar CDF archivos como proxy para supervisar el tráfico de la página, reconciliar discrepancias en los informes o para facturación, etc.

Introducción getting-started

No hay ningún proceso de autoservicio para iniciar la entrega de archivos de CDF. Póngase en contacto con su asesor de Audience Manager o con el Servicio de atención al cliente para comenzar. Durante la implementación, su representante de Audience Manager:

  • Configure su espacio de almacenamiento de Amazon S3.
  • Proporcione credenciales de autenticación S3 de solo lectura al espacio de almacenamiento de archivos. No podrá ver ni acceder a directorios y archivos que pertenezcan a otros clientes.

Las notificaciones de archivos y los archivos de CDF aparecerán en su bloque de S3 cuando estén listos para su descarga. Usted es responsable de supervisar y descargar archivos desde el directorio S3 asignado. Consulte Notificaciones sobre procesamiento de archivos de fuentes de datos de clientes.

Pasos siguientes next-steps

Las secciones siguientes y las Preguntas frecuentes sobre la fuente de datos del cliente pueden ayudarle a familiarizarse con este servicio.

Customer Data Feed contenidos definidos cdf-defined

Enumera y define los elementos de datos y las matrices de un archivo de CDF, por orden de aparición. Las definiciones incluyen tipos de datos, pero esta información no forma parte de un archivo CDF.

IMPORTANT
Los píxeles de evento se excluyen de forma predeterminada en las configuraciones de CDF. Asegúrese de especificar en la solicitud al servicio de atención al cliente si desea que los píxeles de evento se incluyan en los archivos CDF. Cada píxel de evento se rellenará como una fila única en los archivos CDF.

Definiciones definitions

Un archivo de CDF incluye algunos o todos los campos definidos a continuación. Para obtener información acerca de la organización interna de archivos, consulte Estructura de archivos de fuentes de datos de clientes.

Campo
Tipo de datos
Descripción
Event Time
Marca de tiempo

Hora a la que los servidores de recopilación de datos (DCS) procesaron un archivo CDF. La marca de tiempo usa el formato aaaa-mm-dd hhss y está establecida en la zona horaria UTC.

Nota: La hora del evento no es :

Device
Cadena
Este es el ID de usuario único (UUID), que es un ID de dispositivo de 38 dígitos para el visitante del sitio. Vea también índice de ID en el Audience Manager.
Container ID
Numérica
El ID del contenedor que activa la sincronización de ID. Este campo solo se rellena si establece el ID de contenedor en el campo d_nsid dentro de la implementación del sitio. De lo contrario, el valor predeterminado de 0 no se incluirá en los archivos CDF.
Realized Traits
Matriz numérica

Una matriz de ID de rasgos que contiene todos los rasgos para los que un visitante se dio cuenta (cualificado) en la llamada de evento.

Tenga en cuenta que la matriz puede contener características para las que el visitante había cumplido los requisitos antes y para las que volvió a clasificarse a través de esta llamada de evento.

Realized Segments
Matriz numérica
Matriz de ID de segmento que contiene todos los segmentos para los que el visitante se dio cuenta (para los que cumple los requisitos) en la llamada de evento.
Request Parameters
Cadena

Una cadena que captura todos los parámetros (variables, ID, pares clave-valor, ID de publicidad de dispositivo, etc.) pasado en la llamada de evento.

Ejemplo abreviado:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
Cadena
La dirección URL sin codificar de la página de referencia (si la hay).
IP Data Type
Cadena
La dirección IP del visitante capturada en la llamada de evento.
MCDevice
Cadena
El identificador de Experience Cloud (MID) de se asignó al visitante del sitio. Consulte también cookies y el servicio de identidad del Experience Platform de Adobe.
All Segments
Matriz numérica
Matriz de ID de segmento que contiene segmentos para los que se ha realizado anteriormente y nuevos segmentos para los que el visitante está cualificado.
All Traits
Matriz numérica
Una matriz de ID de rasgos de origen y de terceros que contiene rasgos realizados anteriormente y nuevos rasgos para los que el visitante ha cumplido los requisitos desde la última fuente de datos generada.

Estructura de archivos de Customer Data Feed cdf-file-structure

Enumera y define la estructura de datos de un archivo de CDF. Esto incluye la secuencia de datos, los delimitadores y separadores de campo, un mapa del archivo de datos y un archivo de muestra.

Identificadores y secuencia de campos de datos identifiers-and-sequence

CDF archivos no contienen columnas etiquetadas ni encabezados de campo. En su lugar, un archivo de CDF define campos y matrices con ASCII caracteres que no se imprimen. Además, el archivo CDF enumera cada campo y matriz en un orden específico. Comprender los identificadores de campo y el orden le ayudará a analizar el archivo correctamente.

Elemento de archivo CDF
Descripción
Separadores y delimitadores de campos

Estos caracteres no imprimibles definen los elementos y la estructura del archivo CDF:

  • Ctrl + a (ASCII 001 o ^A) separa los datos de los campos individuales con un indicador de espacio no imprimible.
  • Ctrl + b (ASCII 002 o ^B) separa los datos de una matriz y los parámetros de solicitud.
  • Ctrl + c (ASCII 003 o ^C) define pares clave-valor.
Secuencia de campos

Importante: Audience Manager se reserva el derecho de agregar nuevos campos al final del archivo CDF en futuras versiones. Esto significa que el diseño técnico del sistema de análisis de archivos no debe suponer un número fijo de columnas (aunque puede suponer un orden fijo para las columnas existentes).

Los datos del archivo CDF aparecen en el orden indicado a continuación. /N puede aparecer en lugar de cualquiera de estos campos, lo que indica un valor nulo.

  1. Hora del evento
  2. Device
  3. ID de contenedor
  4. Características realizadas
  5. Segmentos realizados
  6. Parámetros de solicitud
  7. Referer
  8. Dirección IP
  9. ID del dispositivo del Experience Cloud (o MID). Consulte también cookies y el servicio de identidad de Adobe Experience Platform
  10. Todos los segmentos
  11. Todas las características

Para obtener descripciones de los campos, consulte Contenido de fuente de datos del cliente definido.

Asignación de archivo de CDF cdf-file-map

CDF los datos del archivo aparecen en el orden que se muestra a continuación.

Identificación de matrices

Las matrices de un archivo CDF comienzan y finalizan con el separador de campos Ctrl + a. Esto hace que el primer elemento de una matriz parezca un campo de datos independiente. Por ejemplo, la matriz traits realizada comienza con ^A1234. El delimitador de matriz y el identificador ^B5678 siguen esta entrada. Como resultado, puede sentirse tentado a pensar que el primer elemento de la matriz traits realizada es el identificador 5678 (porque comienza con ^B). Este no es el caso, por lo que debe estar familiarizado con la secuencia y estructura de un archivo de datos. Aunque el primer elemento de la matriz trait realizada (o cualquiera de las demás matrices de un archivo CDF) comience por ^A, el orden de aparición o posición en el archivo define el inicio de una matriz. Y, el primer elemento de una matriz siempre está separado de la entrada anterior por ^A.

Archivo de muestra CDF sample-file

Un archivo de muestra CDF podría tener un aspecto similar al siguiente. Hemos insertado saltos de línea en este ejemplo para que se ajuste a la página.

Customer Data Feed Convenciones de nombres de archivos cdf-naming-conventions

Las secciones siguientes enumeran y definen los elementos del nombre de archivo CDF.

CDF Nombre de archivo: sintaxis y ejemplo cdf-file-name

Un nombre de archivo típico de CDF contiene los elementos que se enumeran a continuación. Tenga en cuenta que cursiva indica un marcador de posición de variable:

Sintaxis

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Ejemplo

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

En el espacio de almacenamiento de S3, los archivos se ordenan en orden ascendente por id. de socio (PID), día y hora.

CDF elementos de nombre de archivo definidos cdf-file-name-elements

En la tabla siguiente se enumeran y definen los elementos de un nombre de archivo de CDF.

Elemento Nombre de archivo
Descripción
s3://aam-cdf/
Este es el espacio de almacenamiento raíz predeterminado para su archivo CDF en un servidor Amazon S3.
your S3 bucket name
Nombre del contenedor S3 de solo lectura que contiene los archivos CDF.
day=yyyy-mm-dd
La fecha en la que se procesó el archivo.
hour=hh
Un valor de hora expresado en notación de 24 horas y establecido en la zona horaria UTC. Consulte también horas del nombre de archivo de la fuente de datos del cliente y horas del contenido de archivo....
partner ID
Su ID de socio.
File Sequence_0
Valores que identifican la secuencia de archivos. La secuencia se incrementa de la siguiente manera: 0_0_0 , 0_1_0, 0_2_0....1_0_0
.gz
Extensión de archivo gzip. Los archivos CDF están comprimidos en gzip.

Customer Data Feed notificaciones de procesamiento de archivos cdf-file-processing-notifications

Audience Manager escribe un archivo de .info en el directorio S3 para que sepa cuándo su Customer Data File (CDF) está listo para su descarga. El archivo .info también incluye JSON metadatos con formato acerca del contenido de los archivos CDF. Revise esta sección para obtener información sobre la sintaxis y los campos utilizados por este archivo de notificación.

Archivo de información de muestra sample-info-file

Cada archivo .info contiene una sección Files y Totals. La sección Files contiene una matriz que contiene métricas específicas para cada archivo por hora. La sección Totals contiene métricas agregadas en todos sus archivos de CDF para un día en particular. El contenido del archivo .info podría ser similar al del siguiente ejemplo.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Campos de archivo de información definidos info-file-fields-defined

Las siguientes tablas enumeran y definen los elementos de un archivo CDF .info.

Objeto Files

Campo
Descripción
Files
Inicia la matriz que contiene metadatos sobre los archivos CDF.
FileByteSize
Tamaño de archivo en bytes.
FileChecksumMD5
La Amazon S3 ETag. El número que sigue al guión muestra el número de partes utilizadas para crear el archivo durante la carga de varias partes. ETag no es idéntico a la suma de comprobación MD5 del archivo.
FileName
El nombre del archivo. Consulte Convenciones sobre nombres de archivos en fuentes de datos de clientes.
FileSequenceNumber
Un número de índice para cada archivo.

Objeto Totals

Campo
Descripción
Totals
Inicia el objeto que contiene los datos agregados de todos los archivos CDF.
Day
El día para el cual los datos están disponibles. Utiliza el formato aaaa-mm-dd.
Hour
La hora para la que los datos están disponibles. Utiliza el formato de 24 horas establecido en la zona horaria UTC.
TotalByteSize
Tamaño total de todos los archivos CDF para esa fecha en bytes.
TotalNumberFiles
Número total de archivos cargados en el directorio S3.

Customer Data Feed Las horas de nombre de archivo y las horas de contenido de archivo son diferentes different-processing-times

El archivo CDF contiene marcas de tiempo en el nombre y el contenido del archivo. Estas marcas de tiempo registran diferentes procesos de evento para el mismo archivo CDF. No es raro ver marcas de tiempo diferentes en el nombre y el contenido del mismo archivo. Comprender cada marca de tiempo puede ayudarle a evitar errores comunes al trabajar con estos datos o al intentar ordenarlos por tiempo.

Buscando CDF marcas de tiempo de archivos locating-timestamps

CDF archivos registran el tiempo de forma diferente en dos ubicaciones independientes.

Explicación de la diferencia entre marcas de tiempo understanding-timestamps

La siguiente tabla proporciona detalles adicionales sobre las marcas de tiempo del archivo CDF, así como información sobre cómo utilizarlas correctamente.

Ubicación de marca de tiempo
Descripción
Nombre del archivo

La marca de tiempo del nombre de archivo CDF indica la hora en que Audience Manager comenzó a preparar el archivo para su envío. Esta marca de tiempo se establece en la zona horaria UTC. Utiliza el parámetro hour=, con el formato de hora de 2 dígitos en notación de 24 horas. Esta hora puede ser diferente a la hora del evento registrada en el contenido del archivo. Al trabajar con CDF archivos, a veces observará que el espacio de S3 está vacío durante una hora determinada. Un bloque vacío significa que puede significar cualquiera de las siguientes opciones:

  • No hay datos para esa hora en particular.
  • Nuestros servidores están bajo cargas pesadas y no pueden procesar archivos durante una hora en particular. Cuando el servidor se pone al día, coloca los archivos que deberían haber estado en un bloque de tiempo anterior en un bloque con un valor de tiempo posterior. Por ejemplo, verá esto cuando un archivo que debería haber estado en el bloque de horas 17 aparezca en el bloque de horas 18 (con hour=18 en el nombre del archivo). En este caso, es probable que el servidor haya empezado a procesar el archivo en la hora 17, pero no haya podido completarlo en ese intervalo de tiempo. En su lugar, el archivo se inserta en el siguiente bloque de tiempo por hora.

Importante: no use la marca de tiempo del nombre de archivo para agrupar los eventos por hora. Si necesita agrupar por tiempo, utilice la marca de tiempo EventTime en el contenido del archivo.

Contenido de archivo
La marca de tiempo del contenido del archivo CDF marca la hora en que Data Collection Servers comenzó a procesar el archivo. Esta marca de tiempo se establece en la zona horaria UTC. Utiliza el campo EventTime, con el formato de hora yyyy-mm-dd hh:mm:ss. Esta hora está cerca de la hora real del evento en la página, pero puede ser diferente al indicador de hora del nombre del archivo.
Sugerencia: A diferencia de la marca de tiempo hour= en el nombre de archivo, puede usar EventTime para agrupar los datos por hora.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695