8 minutos

Las fuentes de datos de Adobe Analytics proporcionan acceso flexible a los datos sin procesar, lo que permite realizar manipulaciones complejas e integración con otras fuentes. Complementan herramientas como Adobe Analysis Workspace al llenar lagunas analíticas. Las fuentes de datos almacenan cada solicitud al servidor como una fila, se entregan por lotes e incluyen métricas clave. Las tablas agregadas y los filtros globales ayudan a optimizar el análisis y garantizar la coherencia. Esta guía explica su potencial y establece la etapa para una exploración posterior.

Introducción

Las fuentes de datos son una forma eficaz de aprovechar los datos granulares y sin procesar que recopila con Adobe. Al ingerirlos en una base de datos, crea un sinfín de casos de uso interesantes, incluidos los siguientes:

Aunque las fuentes de datos no deben ser el único método para analizar los datos de Adobe Analytics, se pueden utilizar para llenar las lagunas que puede dejar Analysis Workspace, Data Warehouse o Report Builder de Adobe. Piense en las fuentes de datos como una de las muchas herramientas de su kit de herramientas de Adobe Analytics.

Comparación de las fuentes de datos con otras herramientas de Adobe Analytics:
Caso de uso
Espacio de trabajo
Data Warehouse
Fuentes de datos
Informes de rendimiento generales
Óptimo
Posible
Posible
Unir los datos de SSOT con el análisis web e incorporar las herramientas de BI (p. ej., pedidos de sus fuentes de financiación SSOT en comparación con las visitas de Adobe)
Difícil
Posible
Posible
Cambiar definiciones de eVars para métodos de persistencia y atribución
Posible
No es posible
Posible
Aprovechar el modelado fuera de Workspace
Difícil
Posible
Posible

Nota: Este manual de tácticas no va a explicar cómo ingerir fuentes de datos en una base de datos. Se presupone que ya se puede acceder fácilmente a las fuentes de datos para realizar consultas.

Explicación de la fuente de datos
¿Qué son las fuentes de datos?

Cada solicitud al servidor de Adobe Analytics se almacena como una sola fila en una fuente de datos. Se debe configurar una fuente de datos independiente para cada grupo de informes. Los datos se entregan en lotes por hora tras cada hora o en lotes diarios al final de cada día.

En todas las implementaciones, el formato de la fuente de datos sin procesar será el mismo. Aquí tiene una lista completa de todas las columnas disponibles: https://experienceleague.adobe.com/es/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-reference. Esta sección del manual de tácticas resaltará algunas columnas importantes.

Identificadores de ocurrencia (visita), visita y visitante

Para replicar las ocurrencias, visitas y visitantes únicos OOTB, necesitará una combinación de cuatro columnas: post_visid_high, post_visid_low, visit_num y visit_page_num

Aquí está el código SQL inicial para obtener un recuento de visitantes, visitas y ocurrencias:

SELECT
COUNT(DISTINCT CONCAT(POST_VISID_HIGH, POST_VISID_LOW)) AS VISITORS,
COUNT(DISTINCT CONCAT(POST_VISID_HIGH, POST_VISID_LOW, VISIT_NUM)) AS VISITS,
COUNT(DISTINCT CONCAT(POST_VISID_HIGH, POST_VISID_LOW, VISIT_NUM, VISIT_PAGE_NUM)) AS OCCURRENCES
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'

SUGERENCIA: En Adobe Workspace, la dimensión “Profundidad de visita” equivale a la columna de fuente de datos visit_num. La dimensión “Profundidad de la visita” en Workspace equivale a la columna de fuente de datos visit_page_num.

Notas sobre la columna visit_page_num:

SUGERENCIA: Si desea ver las acciones exactas que ha realizado un usuario, puede seleccionar un ID de visitante, ordenarlo por visit_num y, después, por visit_page_num para obtener un recuento visita a visita de sus acciones. Esto es útil a la hora de depurar los recorridos del cliente: pruébelo con sus propias acciones a medida que navega por su propiedad digital.

eVars y props

Cada eVar y prop tiene una columna dedicada en la fuente de datos, sin importar si está habilitada o si tiene datos rellenados. También hay columnas independientes para los valores anteriores y posteriores al procesamiento. La columna posterior al procesamiento tendrá la atribución de eVar y la lógica de caducidad aplicadas.

Consulte este diagrama de flujo para saber cuándo tiene lugar el procesamiento: https://experienceleague.adobe.com/docs/analytics/technotes/processing-order.html?lang=es

En total, habrá 500 columnas de eVars (es decir, 2 conjuntos de 250 eVars posibles que se pueden crear para una implementación) y 150 columnas de props (es decir, 2 conjuntos de 75 props posibles que se pueden configurar).

SUGERENCIA: ¿Alguna vez ha deseado que la eVar que ha captado tuviera las propiedades de una prop? Las columnas de eVar no posteriores se comportan como una prop. Sin atribución de eVar ni lógica de persistencia aplicada, utilice las columnas no posteriores para filtrar las visitas de análisis donde debe estar presente esa eVar, igual que una prop.

Segmentos y métricas calculadas

Los segmentos, las métricas calculadas personalizadas y las métricas listas para su uso de Adobe se deben definir de forma personalizada. Para métricas y segmentos OOTB, consulte la documentación técnica de Adobe.

Aquí encontrará la lógica para replicar algunas métricas comunes: https://experienceleague.adobe.com/es/docs/analytics/export/analytics-data-feed/data-feed-contents/datafeeds-calculate

En la siguiente sección, se proporciona un código de muestra para replicar la métrica de salidas hacia otro sitio OOTB de Adobe como ejemplo. En una próxima publicación de Experience League se proporcionarán más ejemplos de cómo se pueden volver a crear segmentos y métricas con las fuentes de datos.

Consultar fuentes de datos
Conceptos básicos

Nuestra primera consulta contará las visitas de un día concreto excluyendo las visitas innecesarias.

SELECT
COUNT(DISTINCT CONCAT (POST_VISID_HIGH, POST_VISID_LOW, VISIT_NUM)) AS VISITS
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'

A continuación, contaremos las visitas en sus páginas de entrada.

WITH MIN_VISIT_PAGE_NUM_TABLE AS (
SELECT 
POST_VISID_HIGH, 
POST_VISID_LOW,
VISIT_NUM,
MIN(VISIT_PAGE_NUM) AS MIN_VISIT_PAGE_NUM
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1,2,3)

SELECT
PAGE_NAME,
COUNT(DISTINCT A.VISIT_ID) AS ENTRIES
FROM DATA_FEEDS A
LEFT JOIN MIN_VISIT_PAGE_NUM_TABLE B
ON A.POST_VISID_HIGH = B.POST_VISID_HIGH
AND A.POST_VISID_LOW = B.POST_VISID_LOW
AND A.VISIT_NUM = B.VISIT_NUM
AND A.VISIT_PAGE_NUM = B.MIN_VISIT_PAGE_NUM
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1

SUGERENCIA: Para replicar lo anterior para las salidas, busque el MAX_visit_page_num en lugar de MIN.

Finalmente, replicaremos la métrica de salidas hacia otro sitio OOTB.

WITH MAX_VISIT_PAGE_NUM_TABLE AS (
SELECT 
POST_VISID_HIGH, 
POST_VISID_LOW,
VISIT_NUM,
MAX(VISIT_PAGE_NUM) AS MAX_VISIT_PAGE_NUM
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1,2,3),

MIN_VISIT_PAGE_NUM_TABLE AS (
SELECT 
POST_VISID_HIGH, 
POST_VISID_LOW,
VISIT_NUM,
MIN(VISIT_PAGE_NUM) AS MIN_VISIT_PAGE_NUM
FROM DATA_FEEDS
WHERE HIT_SOURCE = '1' AND EXCLUDE_HIT = '0'
GROUP BY 1,2,3)
SELECT
COUNT(DISTINCT A.VISIT_ID) AS BOUNCES
FROM MAX_VISIT_PAGE_NUM A
LEFT JOIN MIN_VISIT_PAGE_NUM_TABLE B
ON A.POST_VISID_HIGH = B.POST_VISID_HIGH
AND A.POST_VISID_LOW = B.POST_VISID_LOW
AND A.VISIT_NUM = B.VISIT_NUM
WHERE A.MAX_VISIT_PAGE_NUM = B.MIN_VISIT_PAGE_NUM
Estrategia de fuente de datos
Crear tablas agregadas

Puede ser beneficioso crear vistas agregadas de la fuente de datos sin procesar. Estos son algunos beneficios:

Los tipos de tablas agregadas necesarios dependerán de cada organización y de sus responsables de departamento. No obstante, aquí tiene algunos ejemplos para empezar:

Tenga en cuenta cómo el usuario final deberá unirse a estas tablas para obtener los resultados que desee. Por ejemplo, puede ser más fácil tener cada tabla agregada que incluya post_visid_high, post_visid_low, visit_num y visit_page_num para poder unir en cualquier nivel de granularidad.

Filtros globales

Algunas organizaciones tienen filtros globales aplicados a todos los informes (p. ej., para excluir bots, eliminar tráfico fraudulento, etc.). Plantéese crear una tabla agregada que replique este filtro y únala a cualquier consulta frente a la fuente de datos sin procesar.

Tener una tabla centralizada elimina la necesidad de mantener esta lógica de filtro a medida que cambia con el tiempo.

Monitorización de discrepancias con Workspace

Al principio del recorrido de la fuente de datos, realice un recuento rápido de visitas por día y asegúrese de que todos los días se correspondan con Workspace. Aunque la fuente de datos esté habilitada, puede haber lagunas en el lado interno de la ingeniería de datos para procesar los archivos o que Adobe haya omitido el envío.

De todas formas, es útil configurar validaciones regulares de que Workspace se sigue alineando con sus fuentes de datos y tablas agregadas.

Conclusión

Gestionar sus fuentes de datos de Adobe puede parecer un proyecto desafiante. Sin embargo, una vez que lo haya dominado, existen un sinfín de posibilidades para personalizar los datos y dar servicio a casos de uso específicos.

Este artículo establece las bases para comprender estas fuentes y solo es la punta del iceberg. Siga pendiente de artículos de Experience League que le ayudarán a profundizar en estos datos enriquecidos.

Recursos adicionales