Componentes de recopilación de datos data-collection-components
Los componentes de recopilación de datos incluyen los servidores de recopilación de datos, la API de DIL, las transferencias de datos de servidor a servidor entrantes y los archivos de registro.
Audience Manager contiene los siguientes componentes de recopilación de datos:
Servidores de recopilación de datos (DCS) y servidores de caché de perfiles (PCS) dcs-pcs
El DCS y el PCS trabajan juntos y ofrecen por separado servicios relacionados con la realización de características, la segmentación de audiencia y el almacenamiento de datos.
Función Data Collection Servers (DCS)
En Audience Manager, el DCS:
- Recibe y evalúa datos de rasgos de una llamada de evento. Esto incluye información utilizada para la segmentación en tiempo real y datos pasados a intervalos programados por transferencias de servidor a servidor.
- Segmenta a los usuarios según sus rasgos comprobados y las reglas de calificación que crees con Generador de segmentos.
- Crea y administra los ID de dispositivo y los ID de perfil autenticados. Esto incluye identificadores como ID de proveedor de datos, ID de usuario, ID declarados, códigos de integración, etc.
- Comprueba en el PCS los rasgos adicionales que un usuario ya ha observado antes de una llamada de evento en tiempo real. Esto permite que el DCS clasifique a los usuarios en función de los datos en tiempo real y los datos históricos.
- Escribe archivos de registro y los envía a sistemas de análisis para su almacenamiento y procesamiento.
DCSAdministra La Demanda MedianteGlobal Server Load Balancing (GSLB)
DCS es un sistema distribuido geográficamente y con equilibrio de carga. Esto significa que Audience Manager puede dirigir las solicitudes hacia y desde un centro de datos regional en función de la ubicación geográfica de un visitante del sitio. Esta estrategia ayuda a mejorar los tiempos de respuesta porque una respuesta de DCS va directamente a un centro de datos que contiene información sobre ese visitante. GSLB hace que nuestro sistema sea eficiente debido a que los datos relevantes se almacenan en caché en los servidores más cercanos al usuario.
En una llamada de evento, la ubicación geográfica se captura en un par clave-valor devuelto en un cuerpo más grande de datos JSON. Este par clave-valor es el parámetro "dcs_region": region ID
.
Como cliente, interactúa con DCS indirectamente a través de nuestro código de recopilación de datos. También puede trabajar directamente con DCS mediante un conjunto de API. Consulte Métodos y código de la API del servidor de recopilación de datos (DCS).
Profile Cache Servers (PCS)
PCS es una base de datos grande (básicamente, una cookie enorme del lado del servidor). Almacena los datos recibidos para los usuarios activos desde las transferencias de servidor a servidor y desde DCS. Los datos de PCS constan de los ID de dispositivo, los ID de perfil autenticados y sus rasgos asociados. Cuando DCS recibe una llamada en tiempo real, comprueba si PCS tiene otros rasgos a los que un usuario pueda pertenecer o para los que califique. Y, si se agrega una característica a un segmento más adelante, esos ID de característica se agregan a PCS y los usuarios pueden calificar para ese segmento automáticamente, sin visitar un sitio o aplicación en particular. PCS ayuda a que Audience Manager comprenda mejor a sus usuarios, ya que puede coincidir y segmentar usuarios en tiempo real o entre bastidores con datos de rasgos nuevos e históricos. Este comportamiento le ofrece una imagen más completa y precisa de sus usuarios que solo de las cualificaciones en tiempo real.
No hay controles de interfaz de usuario que permitan a nuestros clientes trabajar directamente con PCS. El acceso del cliente a PCS es indirecto, a través de su función de almacén de datos y transferencias de datos. El PCS se ejecuta en Apache Cassandra.
Purgando ID inactivos dePCS
Como se indicó anteriormente, PCS almacena los identificadores de rasgos de los usuarios activos. Un usuario activo es cualquier usuario que haya sido visto por los servidores de datos Edge desde cualquier dominio durante los últimos 14 días. Estas llamadas a PCS mantienen a un usuario en un estado activo:
- /event llamadas
- /ibs llamadas (sincronizaciones de ID)
PCS vacía los rasgos si están inactivos durante 17 días. Sin embargo, estos rasgos no se pierden. Están almacenados en el Hadoop. Si se vuelve a ver al usuario en otro momento, el Hadoop vuelve a insertar todos sus rasgos en PCS, normalmente en un período de 24 horas.
Otros DCS/PCS procesos: exclusión de privacidad
Estos sistemas de servidor gestionan las solicitudes de privacidad y de exclusión de los usuarios. La información de cookies del usuario no se recopila en el archivo de registro si un usuario ha excluido la recopilación de datos. Para obtener más información acerca de nuestras políticas de privacidad, consulte el Centro de privacidad de Adobe.
Biblioteca de integración de datos (DIL) dil
DIL es el código que usted coloca en la página para la recopilación de datos. Consulte la API de DIL para obtener más información sobre los servicios y métodos disponibles.
Servidor a servidor entrante inbound-outbound-server
Son sistemas que reciben datos enviados por varias integraciones de servidor a servidor con nuestros clientes. Consulte la documentación sobre envío de datos de audiencia para obtener más información.
Archivos de registro log-files
PCS crea y escribe datos en los archivos de registro. Se envían a otros sistemas de base de datos para su procesamiento, creación de informes y almacenamiento.