Customer Data Feeds customer-data-feeds

Información básica sobre Customer Data Feed los archivos (CDF) e instrucciones sobre cómo empezar. Inicio aquí si está interesado en recibir CDF archivos o simplemente desea más información.

Archivo Contenido y finalidad file-contents-purpose

Un CDF archivo contiene los mismos datos que una Audience Manager llamada de evento (/event) envía a nuestros servidores. Esto incluye los datos gustar los ID de usuario, trait IDs, segment IDsy todos los demás parámetros capturados por una llamada de evento. Los procesos de sistemas internos Audience Manager datos de evento en un CDF archivo con contenido organizados en campos que aparecen en un orden establecido. Audience Manager Intenta generar CDF archivos cada hora y los almacena en un bloque seguro y específico del cliente en un Amazon S3 servidor. Proporcionamos estos archivos para que pueda trabajar con Audience Manager datos fuera de los límites impuestos por nuestra interfaz de usuario.

IMPORTANT
Tenga en cuenta las siguientes restricciones cuando se trabaja con archivos CDF:
  • Antes de configurar el envío de archivo CDF, asegúrese de tener los permisos adecuados de terceros proveedores de datos para la exportación de terceros características. Audience Manager actualmente no admite funcionalidad en la interfaz de usuario para solicitud archivo CDF envío exportar permiso de proveedores de datos de terceros, así que comuníquese con ellos de forma independiente.
  • No debe utilizar CDF los archivos como proxy para monitor Página tráfico, conciliar discrepancias en el informe, o para facturación, etc.

Introducción getting-started

No hay ningún proceso de autoservicio para inicio CDF archivo envío. Para comenzar, póngase en contacto con su asesor o con el Audience Manager Servicio de atención al cliente. Durante implementación, su Audience Manager representante:

  • Configure el bucket de Amazon S3 almacenamiento.
  • Proporcione credenciales de autenticación de solo S3 lectura a su archivo almacenamiento bucket. No podrá ver ni acceder a directorios y archivos que pertenezcan a otros clientes.

Archivo notificaciones y CDF archivos aparecerán en su S3 bucket cuando estén listos para descargar. Usted es responsable de supervisar y descargar archivos de su directorio asignado S3 . Consulte Notificaciones sobre procesamiento de archivos de fuentes de datos de clientes.

Pasos siguientes next-steps

Las secciones siguientes y las preguntas frecuentes sobre la fuente de datos delcliente pueden ayudarle a familiarizarse con este servicio.

Customer Data Feed Contenido definido cdf-defined

Enumera y define los elementos de datos y las matrices de un CDF archivo, por orden de apariencia. Las definiciones incluyen tipos de datos, pero esta información no forma parte de un CDF archivo.

IMPORTANT
Los píxeles de evento se excluyen de forma predeterminada en las configuraciones de CDF. Asegúrese de especificar en su solicitud a Client Care si desea incluir evento píxeles en sus archivos CDF. Cada píxel evento se completará como una fila única en sus archivos CDF.

Definiciones definitions

Un CDF archivo incluye algunos o todos los campos definidos a continuación. Para obtener información sobre la organización interna de archivos, consulte Estructura del Archivo de la fuente de datos del cliente.

Campo
Tipo de datos
Descripción
Event Time
Timestamp

La hora en que un archivo CDF fue procesado por los servidores de recopilación de datos (DCS). La marca de hora utiliza la formato aaaa-mm-dd hhss y se establece en la zona horaria UTC.

Nota: El Tiempo del evento no es:

Device
Cadena
Este es el ID de usuario único (UUID), que es un ID de dispositivos de 38 dígitos para su visitante del sitio. Consulte también Index de ID en Audience Manager.
Container ID
Numérica
El ID de la contenedor que activa la sincronización de ID. Este campo solo se rellena si establece el ID de contenedor en el campo d_nsid del sitio implementación. De lo contrario, el valor predeterminado de 0 no se incluirá en los archivos CDF.
Realized Traits
Matriz numérica

Matriz de ID de rasgos que contiene todas las características que un visitante ha obtenido (para el que está cualificado) en la llamada de evento.

Tenga en cuenta que la matriz puede contener características para las que el visitante había calificado antes y para las que vuelve a calificar a través de esta llamada de evento.

Realized Segments
Matriz numérica
Matriz de ID de segmento que contiene todos los segmentos que un visitante realizó (para los cualificó) en la llamada de evento.
Request Parameters
Cadena

Una cadena que captura todos los parámetros (variables, ID, pares clave-valor, ID dispositivos publicidad, etc.) transferidos en la llamada evento.

Ejemplo abreviado:

d_rtbd:json,c_contextData.a.CarrierName:mobile,c_contextData.a.adid:92D56353-49C5-431E-B474-FC528D585810,c_contextData.a,RunMode:Application,c_contextData.a.DaysSinceLastUpgrade:61,d_cid_ic:xid%01EACB6E40-AC65-4012-9FE9-ABD59965E9C4%011,c_contextData.a.PrevSessionLength:583

Referer Data Type
Cadena
La URL no codificada de la Página de referencia (en caso de haberla).
IP Data Type
Cadena
Dirección IP del visitante capturado en la llamada de evento.
MCDevice
Cadena
ID de Experience Cloud (MID) asignado al visitante del sitio. Consulte también Cookies y el servicio de Adobe Experience Platform ID.
All Segments
Matriz numérica
Matriz de ID de segmento que contiene segmentos realizados anteriormente y segmentos nuevos para los que el visitante está cualificado.
All Traits
Matriz numérica
Matriz de ID de características de primera y terceros que contiene características realizadas anteriormente y nuevas características para las que el visitante ha calificado desde la última fuente de datos generada.

Customer Data Feed Estructura Archivo cdf-file-structure

Enumera y define la estructura de datos de un CDF archivo. Esto incluye Secuencia de datos, delimitadores y separadores de campo, un mapa de archivos de datos y un archivo de muestra.

Secuencia e identificadores de campo de datos identifiers-and-sequence

CDF Los archivos no contienen columnas ni encabezados de campo etiquetados. En su lugar, un archivo define campos CDF y matrices con caracteres de no impresión ASCII . Además, el CDF archivo enumera cada campo y matriz en un orden específico. Comprender los identificadores de campo y el orden le ayudará a analizar el archivo correctamente.

Elemento Archivo CDF
Descripción
Separadores y delimitadores de campos

Estos caracteres de no impresión definen los elementos y la estructura de su archivo CDF:

  • Ctrl + a (ASCII 001 o ^A) separa los datos de campos individuales con un indicador de espacio de no impresión.
  • Ctrl + b (ASCII 002 o ^B) separa los datos de una matriz y solicitud parámetros.
  • Ctrl + c (ASCII 003 o ^C) define pares clave-valor.
Secuencia de campos

Importante: Audience Manager se reserva el derecho de añadir nuevos campos al final del archivo CDF en futuras versiones. Esto significa que el diseño técnico del sistema de análisis de archivos no debe suponer un número fijo de columnas (aunque puede suponer un orden fijo para las columnas existentes).

Los datos en su archivo CDF aparecen en el orden que se muestra a continuación. /N puede aparecer en lugar de cualquiera de estos campos, lo que indica un valor nulo.

  1. Hora del evento
  2. Device
  3. ID de contenedor
  4. Características realizadas
  5. Segmentos realizados
  6. Parámetros de solicitud
  7. Sitio de referencia
  8. Dirección IP
  9. Experience Cloud ID de dispositivo (o MID). Consulte también Cookies y el servicio de identidad de Adobe Experience Platform
  10. Todos los segmentos
  11. Todas las características

Para ver descripciones de los campos, consulte Definición del contenido de la fuente de datos del cliente.

CDF Mapa Archivo cdf-file-map

CDF Los datos del archivo aparecen en el orden que se muestra a continuación.

Identificación de matrices

Las matrices de un CDF archivo inicio y terminan con el separador de Ctrl + a campos. Esto hace que el primer elemento de una matriz aparezca gustar campo de datos independiente. Por ejemplo, la matriz realizada traits comienza con ^A1234. El ID y el delimitador ^B5678 de la matriz siguen a esta entrada. Como resultado, podría sentirse tentado a pensar que el primer elemento en la matriz realizada traits es ID 5678 (porque comienza con ^B). Este no es el caso, por lo que debe estar familiarizado con el Secuencia y la estructura de un archivo de datos. Aunque el primer elemento de la matriz realizada trait (o cualquiera de las otras matrices de un CDF archivo) comienza con ^A, el orden de aparición o posición en el archivo define la inicio de una matriz. Y, el primer elemento de una matriz siempre está separado de la entrada anterior por ^A.

Ejemplo CDF de Archivo sample-file

Un archivo de muestra CDF puede tener un aspecto similar al siguiente. Hemos insertado saltos de línea en este ejemplo para ayudar a que se ajuste al Página.

Customer Data Feed Archivo convenciones de nomenclatura cdf-naming-conventions

Las secciones siguientes lista y definen los elementos en CDF su nombre de archivo.

CDF Nombre de Archivo: sintaxis y ejemplo cdf-file-name

Un nombre de archivo típico CDF contiene los elementos enumerados a continuación. Nota: La letra en cursiva indica un marcador de posición variable:

Sintaxis

s3://aam-cdf/YOUR-S3-BUCKET-NAME/day=yyyy-mm-dd/hour=hh/AAM-CDF_PARTNER-ID_FILE-SEQUENCE_0.gz

Ejemplo

s3://aam-cdf/dataCompany/day=2017-09-14/hour=17/AAM_CDF_1234_0_0_0.gz

En su S3 bloque almacenamiento, los archivos se ordenan de forma ascendente por ID de socio (PID), día y hora.

CDF Archivo Elementos de nombre definidos cdf-file-name-elements

En la tabla siguiente se enumeran y definen los elementos de un CDF nombre de archivo.

Archivo elemento Name
Descripción
s3://aam-cdf/
Este es el bucket de almacenamiento raíz predeterminado para su archivo CDF en un servidor Amazon S3.
your S3 bucket name
Nombre del bucket S3 de solo lectura que contiene sus archivos CDF.
day=yyyy-mm-dd
La fecha en que se procesó el archivo.
hour=hh
Un valor de hora expresado en notación de 24 horas y establecido en la zona horaria UTC. Consulte también Fuente de datos del cliente Archivo Horas de nombres y Archivo Horas de contenido....
partner ID
Su ID socio.
File Sequence_0
Valores que identifican el Secuencia de archivo. El Secuencia aumenta de la siguiente manera: 0_0_0 , 0_1_0, 0_2_0....1_0_0
.gz
Una extensión de archivo gzip. Los archivos CDF están comprimidos gzip.

Customer Data Feed Archivo notificaciones de procesamiento cdf-file-processing-notifications

Audience Manager escribe un .info archivo en el S3 directorio para avisarle cuando su Customer Data File (CDF) esté listo para descargar. El .info archivo también incluye JSON metadatos con formato sobre el contenido de los CDF archivos. Consulte esta sección para obtener información sobre la sintaxis y los campos utilizados por este archivo notificación.

Información de muestra Archivo sample-info-file

Cada .info archivo contiene una Files sección and Totals . Esta Files sección contiene una matriz que contiene métricas específicas para cada archivo por hora. Esta Totals sección contiene métricas agregadas en todos los CDF archivos para un día en particular. El contenido del .info archivo podría ser similar al del siguiente ejemplo.

{
    "Files": [
        {
            "FileByteSize": 2709730,
            "FileChecksumMD5": "a9ea418e79511642cff11c2a898037dc-1",
            "FileName": "AAM_CDF_1109_000000_0.gz",
            "FileSequenceNumber": 1
        },
        {
            "FileByteSize": 2783351,
            "FileChecksumMD5": "7b469485d60274b6991acd0817855840-3",
            "FileName": "AAM_CDF_1109_000001_0.gz",
            "FileSequenceNumber": 2
        }
    ],
    "Totals": {
        "Day": "2017-09-26",
        "Hour": "18",
        "TotalByteSize": 150092997,
        "TotalNumberFiles": 2
    }
}

Información Archivo campos definidos info-file-fields-defined

Las tablas siguientes lista y definen los elementos de un CDF .info archivo.

Archivos objeto

Campo
Descripción
Files
Inicia la matriz que contiene metadatos sobre los archivos CDF.
FileByteSize
Archivo tamaño en bytes.
FileChecksumMD5
La Amazon S3 ETag. El número que sigue al guión muestra el número de partes utilizadas para versión el archivo durante el cargar de varias partes. El ETag no es idéntico a la suma de comprobación MD5 del archivo.
FileName
El nombre del archivo. Consulte Fuente de datos de cliente Archivo convenciones de nomenclatura.
FileSequenceNumber
Un número de índice para cada archivo.

Objeto Totales

Campo
Descripción
Totals
Inicia el objeto que contiene los datos agregados sobre todos los archivos CDF.
Day
El día para el cual los datos están disponibles. Utiliza formato-mm-dd aaaa.
Hour
Hora para la cual hay datos disponibles. Utiliza formato de 24 horas definidas en la zona horaria UTC.
TotalByteSize
Tamaño total de todos sus archivos CDF para esa fecha en bytes.
TotalNumberFiles
Número total de archivos cargados en el directorio S3.

Customer Data Feed Nombre Archivo Las horas y las horas del contenido Archivo son diferentes different-processing-times

El CDF archivo contiene marcas de tiempo en el nombre y el contenido del archivo. Estas marcas de tiempo registran diferentes procesos evento para el mismo CDF archivo. No es raro ver diferentes marcas de tiempo en el nombre y el contenido del mismo archivo. Comprender cada marca de tiempo puede ayudarlo a evitar errores comunes al trabajar con estos datos o intentar ordenarlos por tiempo.

Localización CDF de marcas de hora de Archivo locating-timestamps

CDF Los archivos registran el tiempo de manera diferente en 2 ubicaciones separadas.

Comprender la diferencia entre marcas de hora understanding-timestamps

En la tabla siguiente se proporcionan detalles adicionales sobre las marcas de tiempo de los CDF archivos, así como información sobre cómo utilizarlos correctamente.

Ubicación de la marca de tiempo
Descripción
Nombre del archivo

La marca de tiempo en el nombre de archivo marca el momento en CDF el que Audience Manager se comenzó a preparar el archivo para la envío. Esta marca de tiempo se establece en la UTC zona horaria. Utiliza el parámetro, con el formato de hour= hora como una hora de 2 dígitos en notación de 24 horas. Este tiempo puede ser diferente del tiempo de evento registrado en el contenido del archivo. Al trabajar con CDF archivos, a veces notará que su S3 cubo está vacío durante una hora en particular. Un bucket vacío significa que puede significar cualquiera de los siguientes medios:

  • No hay datos para esa hora en particular.
  • Nuestros servidores están sometidos a cargas pesadas y no pueden procesar archivos durante una hora en particular. Cuando el servidor se pone al día, coloca los archivos que deberían haber ido en un bucket de tiempo anterior en un bucket con un valor de tiempo posterior. Por ejemplo, verá esto cuando un archivo que debería haber estado en el cubo de la hora 17 aparezca en el cubo de la hora 18 (con hour=18 en el nombre del archivo). En este caso, el servidor probablemente comenzó a procesar su archivo en la hora 17 pero no pudo completarlo dentro de ese intervalo de tiempo. En su lugar, el archivo se inserta en el siguiente bloque de tiempo por hora.

Importante: No utilice la marca de tiempo del nombre de archivo para grupo eventos por tiempo. Si necesita grupo por tiempo, utilice la marca de EventTime tiempo en el contenido del archivo.

Contenido Archivo
La marca de tiempo en CDF el contenido del archivo marca el tiempo en que Data Collection Servers se inició el procesamiento del archivo. Esta marca de tiempo se establece en la UTC zona horaria. Utiliza el campo, con el formato de EventTime tiempo como yyyy-mm-dd hh:mm:ss. Esta hora es cercana a la hora real de la evento en el Página, pero puede ser diferente del indicador de hora en el nombre del archivo.
Sugerencia: a diferencia de la marca de hour= tiempo en el nombre del archivo, puede usar EventTime para grupo datos por tiempo.
recommendation-more-help
de293fbf-b489-49b0-8daa-51ed303af695