Las fuentes de datos de Adobe Analytics proporcionan acceso flexible a los datos sin procesar, lo que permite realizar manipulaciones complejas e integración con otras fuentes. Complementan herramientas como Adobe Analysis Workspace al llenar lagunas analíticas. Las fuentes de datos almacenan cada solicitud al servidor como una fila, se entregan por lotes e incluyen métricas clave. Las tablas agregadas y los filtros globales ayudan a optimizar el análisis y garantizar la coherencia. Esta guía explica su potencial y establece la etapa para una exploración posterior.
Introducción
Las fuentes de datos son una forma eficaz de aprovechar los datos granulares y sin procesar que recopila con Adobe. Al ingerirlos en una base de datos, crea un sinfín de casos de uso interesantes, incluidos los siguientes:
-
Flexibilidad incomparable para manipular los datos exactamente como los necesita (p. ej., cambiar la persistencia de la eVar, lógica secuencial compleja)
-
Unir datos de Adobe Analytics con otras fuentes de datos para habilitar la creación de informes 360 o como entradas para modelos y controladores de decisión
Aunque las fuentes de datos no deben ser el único método para analizar los datos de Adobe Analytics, se pueden utilizar para llenar las lagunas que puede dejar Analysis Workspace, Data Warehouse o Report Builder de Adobe. Piense en las fuentes de datos como una de las muchas herramientas de su kit de herramientas de Adobe Analytics.
Comparación de las fuentes de datos con otras herramientas de Adobe Analytics:
Caso de uso
Espacio de trabajo
Data Warehouse
Fuentes de datos
Nota: Este manual de tácticas no va a explicar cómo ingerir fuentes de datos en una base de datos. Se presupone que ya se puede acceder fácilmente a las fuentes de datos para realizar consultas.
-
Para obtener instrucciones sobre cómo configurar e ingerir fuentes de datos, consulte: https://experienceleague.adobe.com/docs/analytics/export/analytics-data-feed/data-feed-overview.html?lang=es
-
Para obtener un resumen de los archivos que se incluyen en la fuente de datos: https://experienceleague.adobe.com/es/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-contents
Explicación de la fuente de datos
¿Qué son las fuentes de datos?
Cada solicitud al servidor de Adobe Analytics se almacena como una sola fila en una fuente de datos. Se debe configurar una fuente de datos independiente para cada grupo de informes. Los datos se entregan en lotes por hora tras cada hora o en lotes diarios al final de cada día.
En todas las implementaciones, el formato de la fuente de datos sin procesar será el mismo. Aquí tiene una lista completa de todas las columnas disponibles: https://experienceleague.adobe.com/es/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-reference. Esta sección del manual de tácticas resaltará algunas columnas importantes.
Identificadores de ocurrencia (visita), visita y visitante
Para replicar las ocurrencias, visitas y visitantes únicos OOTB, necesitará una combinación de cuatro columnas: post_visid_high, post_visid_low, visit_num y visit_page_num
-
Visitantes únicos: se utiliza una concatenación de post_visid_high y post_visid_low para obtener un ID de visitante. Los distintos recuentos de este ID de visitante replicarán visitantes únicos.
-
Visitas: se utiliza una concatenación de post_visid_high, post_visid_low y visit_num para obtener un ID de visita. Los distintos recuentos de este ID de visita replicarán visitas. Debido a la colisión de hash, es posible que tenga que concatenar también con visit_start_time_gmt
-
Ocurrencias: se utiliza una concatenación de post_visid_high, post_visid_low, visit_num y visit_page_num para obtener un ID de visita. Los distintos recuentos de este ID de visita replicarán ocurrencias.
Aquí está el código SQL inicial para obtener un recuento de visitantes, visitas y ocurrencias:
SELECT
COUNT(DISTINCT CONCAT(POST_VISID_HIGH, POST_VISID_LOW)) AS VISITORS,
COUNT(DISTINCT CONCAT(POST_VISID_HIGH, POST_VISID_LOW, VISIT_NUM)) AS VISITS,
COUNT(DISTINCT CONCAT(POST_VISID_HIGH, POST_VISID_LOW, VISIT_NUM, VISIT_PAGE_NUM)) AS OCCURRENCES
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
SUGERENCIA: En Adobe Workspace, la dimensión “Profundidad de visita” equivale a la columna de fuente de datos visit_num. La dimensión “Profundidad de la visita” en Workspace equivale a la columna de fuente de datos visit_page_num.
Notas sobre la columna visit_page_num:
-
No se confunda con el “page” del nombre de la columna visit_page_num. Esto no solo aumenta en las vistas de página, sino que se incrementa en cada solicitud al servidor de análisis.
-
Las visitas no siempre comienzan con visit_page_num = 1, pero debería ser así en la mayoría de los casos. Para obtener informes precisos, si necesita extraer la primera visita de una visita, calcule el visit_page_num mínimo de un ID de visita.
SUGERENCIA: Si desea ver las acciones exactas que ha realizado un usuario, puede seleccionar un ID de visitante, ordenarlo por visit_num y, después, por visit_page_num para obtener un recuento visita a visita de sus acciones. Esto es útil a la hora de depurar los recorridos del cliente: pruébelo con sus propias acciones a medida que navega por su propiedad digital.
eVars y props
Cada eVar y prop tiene una columna dedicada en la fuente de datos, sin importar si está habilitada o si tiene datos rellenados. También hay columnas independientes para los valores anteriores y posteriores al procesamiento. La columna posterior al procesamiento tendrá la atribución de eVar y la lógica de caducidad aplicadas.
Consulte este diagrama de flujo para saber cuándo tiene lugar el procesamiento: https://experienceleague.adobe.com/docs/analytics/technotes/processing-order.html?lang=es
En total, habrá 500 columnas de eVars (es decir, 2 conjuntos de 250 eVars posibles que se pueden crear para una implementación) y 150 columnas de props (es decir, 2 conjuntos de 75 props posibles que se pueden configurar).
SUGERENCIA: ¿Alguna vez ha deseado que la eVar que ha captado tuviera las propiedades de una prop? Las columnas de eVar no posteriores se comportan como una prop. Sin atribución de eVar ni lógica de persistencia aplicada, utilice las columnas no posteriores para filtrar las visitas de análisis donde debe estar presente esa eVar, igual que una prop.
Segmentos y métricas calculadas
Los segmentos, las métricas calculadas personalizadas y las métricas listas para su uso de Adobe se deben definir de forma personalizada. Para métricas y segmentos OOTB, consulte la documentación técnica de Adobe.
Aquí encontrará la lógica para replicar algunas métricas comunes: https://experienceleague.adobe.com/es/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-calculate
En la siguiente sección, se proporciona un código de muestra para replicar la métrica de salidas hacia otro sitio OOTB de Adobe como ejemplo. En una próxima publicación de Experience League se proporcionarán más ejemplos de cómo se pueden volver a crear segmentos y métricas con las fuentes de datos.
Consultar fuentes de datos
Conceptos básicos
Nuestra primera consulta contará las visitas de un día concreto excluyendo las visitas innecesarias.
SELECT
COUNT(DISTINCT CONCAT (POST_VISID_HIGH, POST_VISID_LOW, VISIT_NUM)) AS VISITS
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
A continuación, contaremos las visitas en sus páginas de entrada.
WITH MIN_VISIT_PAGE_NUM_TABLE AS (
SELECT
POST_VISID_HIGH,
POST_VISID_LOW,
VISIT_NUM,
MIN(VISIT_PAGE_NUM) AS MIN_VISIT_PAGE_NUM
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1,2,3)
SELECT
PAGE_NAME,
COUNT(DISTINCT A.VISIT_ID) AS ENTRIES
FROM DATA_FEEDS A
LEFT JOIN MIN_VISIT_PAGE_NUM_TABLE B
ON A.POST_VISID_HIGH = B.POST_VISID_HIGH
AND A.POST_VISID_LOW = B.POST_VISID_LOW
AND A.VISIT_NUM = B.VISIT_NUM
AND A.VISIT_PAGE_NUM = B.MIN_VISIT_PAGE_NUM
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1
SUGERENCIA: Para replicar lo anterior para las salidas, busque el MAX_visit_page_num en lugar de MIN.
Finalmente, replicaremos la métrica de salidas hacia otro sitio OOTB.
WITH MAX_VISIT_PAGE_NUM_TABLE AS (
SELECT
POST_VISID_HIGH,
POST_VISID_LOW,
VISIT_NUM,
MAX(VISIT_PAGE_NUM) AS MAX_VISIT_PAGE_NUM
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1,2,3),
MIN_VISIT_PAGE_NUM_TABLE AS (
SELECT
POST_VISID_HIGH,
POST_VISID_LOW,
VISIT_NUM,
MIN(VISIT_PAGE_NUM) AS MIN_VISIT_PAGE_NUM
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1,2,3)
SELECT
COUNT(DISTINCT A.VISIT_ID) AS BOUNCES
FROM MAX_VISIT_PAGE_NUM A
LEFT JOIN MIN_VISIT_PAGE_NUM_TABLE B
ON A.POST_VISID_HIGH = B.POST_VISID_HIGH
AND A.POST_VISID_LOW = B.POST_VISID_LOW
AND A.VISIT_NUM = B.VISIT_NUM
WHERE A.MAX_VISIT_PAGE_NUM = B.MIN_VISIT_PAGE_NUM
Estrategia de fuente de datos
Crear tablas agregadas
Puede ser beneficioso crear vistas agregadas de la fuente de datos sin procesar. Estos son algunos beneficios:
-
Más fácil para los usuarios finales: un científico de datos promedio que desee aprovechar estos datos no tendrá que preocuparse por qué eVar de comercialización utilizar ni cómo analizar la lista de eventos.
-
Carga de consulta reducida: la fuente de datos puede ser un conjunto de datos grande en terabytes. Su equipo de ingeniería de datos le dará las gracias por reducir las consultas del conjunto de datos sin procesar y dirigir a los usuarios finales a tablas más pequeñas y manejables.
Los tipos de tablas agregadas necesarios dependerán de cada organización y de sus responsables de departamento. No obstante, aquí tiene algunos ejemplos para empezar:
-
Tabla de detalles del usuario: contiene todos los datos de visitas y páginas (p. ej., nombre de página, canal de último contacto, dispositivo móvil)
-
Tabla de eventos clave: contiene una product_list analizada y todos los eventos que se produjeron en esa visita
-
Tabla de términos de búsqueda: contiene todos los términos de búsqueda creados y las métricas relacionadas con la búsqueda
Tenga en cuenta cómo el usuario final deberá unirse a estas tablas para obtener los resultados que desee. Por ejemplo, puede ser más fácil tener cada tabla agregada que incluya post_visid_high, post_visid_low, visit_num y visit_page_num para poder unir en cualquier nivel de granularidad.
Filtros globales
Algunas organizaciones tienen filtros globales aplicados a todos los informes (p. ej., para excluir bots, eliminar tráfico fraudulento, etc.). Plantéese crear una tabla agregada que replique este filtro y únala a cualquier consulta frente a la fuente de datos sin procesar.
Tener una tabla centralizada elimina la necesidad de mantener esta lógica de filtro a medida que cambia con el tiempo.
Monitorización de discrepancias con Workspace
Al principio del recorrido de la fuente de datos, realice un recuento rápido de visitas por día y asegúrese de que todos los días se correspondan con Workspace. Aunque la fuente de datos esté habilitada, puede haber lagunas en el lado interno de la ingeniería de datos para procesar los archivos o que Adobe haya omitido el envío.
De todas formas, es útil configurar validaciones regulares de que Workspace se sigue alineando con sus fuentes de datos y tablas agregadas.
Conclusión
Gestionar sus fuentes de datos de Adobe puede parecer un proyecto desafiante. Sin embargo, una vez que lo haya dominado, existen un sinfín de posibilidades para personalizar los datos y dar servicio a casos de uso específicos.
Este artículo establece las bases para comprender estas fuentes y solo es la punta del iceberg. Siga pendiente de artículos de Experience League que le ayudarán a profundizar en estos datos enriquecidos.
Recursos adicionales
-
Cómo configurar fuentes de datos: https://experienceleague.adobe.com/docs/analytics/export/analytics-data-feed/data-feed-overview.html?lang=es
-
Resumen de los archivos que se incluyen en la fuente de datos: https://experienceleague.adobe.com/es/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-contents
-
Columnas de fuente de datos de Adobe: https://experienceleague.adobe.com/es/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-reference
-
Diagrama de flujo del procesamiento de datos de Adobe: https://experienceleague.adobe.com/docs/analytics/technotes/processing-order.html?lang=es
-
Cómo replicar métricas calculadas comunes con fuentes de datos: https://experienceleague.adobe.com/es/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-calculate