Componentes de recopilación de datos

Los componentes de recopilación de datos incluyen los servidores de recopilación de datos, la API de DIL, las transferencias de datos de servidor a servidor entrantes y los archivos de registro.

El Audience Manager contiene los siguientes componentes de recopilación de datos:

Servidores de recopilación de datos (DCS) y servidores de caché de perfil (PCS)

El DCS y el PCS colaboran y proporcionan por separado servicios relacionados con la realización de características, la segmentación de audiencias y el almacenamiento de datos.

Data Collection Servers (DCS)Función

En Audience Manager, el DCS:

  • Recibe y evalúa los datos de rasgos de una llamada de evento. Esto incluye información utilizada para la segmentación en tiempo real y datos pasados a intervalos programados mediante transferencias de servidor a servidor.
  • Segmenta a los usuarios en función de sus características realizadas y las reglas de calificación que cree con el Generador de segmentos.
  • Crea y administra ID de dispositivo e ID de perfil autenticados. Esto incluye identificadores como ID de proveedores de datos, ID de usuario, ID declarados, códigos de integración, etc.
  • Comprueba que el PCS tenga características adicionales que un usuario ya ha realizado antes de una llamada de evento en tiempo real. Esto permite que el DCS clasifique a los usuarios según los datos en tiempo real y los datos históricos.
  • Escribe archivos de registro y los envía a sistemas de análisis para su almacenamiento y procesamiento.

DCSGestiona La Demanda MedianteGlobal Server Load Balancing (GSLB)

El DCS es un sistema distribuido geográficamente y con equilibrio de carga. Esto significa que Audience Manager puede dirigir las solicitudes hacia y desde un centro de datos regional en función de la ubicación geográfica de un visitante del sitio. Esta estrategia ayuda a mejorar los tiempos de respuesta porque una respuesta DCS va directamente a un centro de datos que contiene información sobre ese visitante. GSLB hace que nuestro sistema sea eficiente porque los datos relevantes se almacenan en caché en los servidores más cercanos al usuario.

IMPORTANTE

El DCS solo detecta el tráfico web originado por dispositivos que utilizan IPv4.

En una llamada de evento, la ubicación geográfica se captura en un par clave-valor devuelto en un cuerpo mayor de datos JSON. Este par clave-valor es el parámetro "dcs_region": region ID.

Como cliente, interactúa con DCS indirectamente a través de nuestro código de recopilación de datos. También puede trabajar directamente con DCS a través de un conjunto de API. Consulte Métodos y código de la API del servidor de recopilación de datos (DCS).

Profile Cache Servers (PCS)

El PCS es una base de datos grande (básicamente, una enorme cookie del lado del servidor). Almacena los datos recibidos para los usuarios activos desde las transferencias de servidor a servidor y desde DCS. Los datos PCS constan de los ID de dispositivo, ID de perfil autenticados y sus rasgos asociados. Cuando el DCS recibe una llamada en tiempo real, comprueba el PCS de otros rasgos a los que un usuario puede pertenecer o para los que califique. Además, si se agrega un rasgo a un segmento más adelante, esos ID de rasgo se añaden al PCS y los usuarios pueden calificarse para ese segmento automáticamente, sin necesidad de visitar un sitio o aplicación concretos. El PCS ayuda a comprender mejor a los usuarios porque puede hacer coincidir y segmentar a los usuarios en tiempo real o entre bastidores con datos de características nuevos e históricos. Audience Manager Este comportamiento le ofrece una imagen más completa y precisa de los usuarios que de las cualificaciones en tiempo real.

No hay controles de interfaz de usuario que permitan a nuestros clientes trabajar directamente con PCS. El acceso de los clientes al PCS es indirecto, ya que se trata de un almacén de datos y de transferencias de datos. El PCS se ejecuta en Apache Cassandra.

Depuración de ID inactivos desde elPCS

Como se indicó anteriormente, el PCS almacena los ID de rasgos para los usuarios activos. Un usuario activo es cualquier usuario que haya sido visto por los servidores de datos Edge desde cualquier dominio durante los últimos 14 días. Estas llamadas a PCS mantienen a un usuario en estado activo:

  • /event llamadas
  • /ibs llamadas (sincronizaciones de ID)

El PCS borra los rasgos si están inactivos durante 17 días. Sin embargo, estos rasgos no se pierden. Están almacenados en el Hadoop. Si se vuelve a ver al usuario en otro momento, el Hadoop reenvía todos sus rasgos a PCS, normalmente dentro de un período de 24 horas.

Otros DCS/PCS procesos: Exclusión de privacidad

Estos sistemas de servidor administran las solicitudes de privacidad y exclusión de los usuarios. La información de las cookies de usuario no se recopila en el archivo de registro si un usuario ha excluido la recopilación de datos. Para obtener más información sobre nuestras políticas de privacidad, consulte el Centro de privacidad del Adobe.

Biblioteca de integración de datos (DIL)

DIL es el código que se coloca en la página para la recopilación de datos. Consulte la API del DIL para obtener más información sobre los servicios y métodos disponibles.

Servidor a servidor entrante

Son sistemas que reciben datos enviados por varias integraciones servidor a servidor con nuestros clientes. Consulte la documentación sobre envío de datos de audiencia para obtener más información.

Archivos de registro

El PCS crea y escribe datos en los archivos de registro. Se envían a otros sistemas de bases de datos para procesamiento, reporting y almacenamiento.

En esta página