Resolução de problemas de identificação de prop de Entrada/Saída no Adobe Analytics
Os valores de prop de entrada e saída nos feeds de dados do Adobe Analytics não são rotulados explicitamente, o que pode tornar a análise no nível da visita mais complexa. Se estiver tentando entender como extrair essas dimensões de dados brutos, este artigo fornece um método claro para obtê-las usando identificadores de visita e carimbos de data e hora. Ao isolar o primeiro e o último valor de um determinado post_propX, é possível reconstruir as dimensões de entrada e saída para obter relatórios mais precisos.
Descrição description
Ambiente
Adobe Analytics
Problema/Sintomas
As dimensões de prop de entrada e saída não são rotuladas explicitamente como Entrada ou Saída nos feeds de dados do Adobe, mas são derivadas da coluna post_propX
. Para determinar qual prop foi acionado na entrada e qual na saída, isole os valores primeiro (Entrada) e último (Saída) da prop para cada visita. Isso requer o processamento de dados brutos usando informações de visita e nível de ocorrência.
Resolução resolution
Como os valores de prop de entrada e saída não são rotulados diretamente nos feeds de dados do Adobe Analytics, você precisa derivá-los processando os dados brutos. Isso envolve agrupar ocorrências por visita, classificá-las cronologicamente e identificar o primeiro e o último valores não vazios da coluna post_propX
relevante. As etapas abaixo descrevem como abordar isso usando SQL ou ferramentas semelhantes.
-
Colunas principais para identificação de visitas:
post_visid_high
epost_visid_low
: concatene-os para identificar visitantes únicos.visit_num
: Identifica o número da visita de um visitante.visit_page_num
: a dimensão Profundidade da ocorrência. Incrementa em 1 para cada ocorrência que o visitante gera e redefine com cada visita.visit_start_time_gmt
: carimbo de data e hora (em horário UNIX) quando os servidores de coleta de dados da Adobe receberam a ocorrência.hit_time_gmt
: Carimbo de data e hora (em horário UNIX) quando os servidores de coleta de dados da Adobe receberam a ocorrência, expresso em horário UNIX.
Para derivar as dimensões de Entrada e Saída de um feed de dados, processe os dados brutos (por exemplo, usando uma ferramenta como Python, SQL ou R) para identificar o primeiro e o último valores de prop para cada visita. A query precisaria levar em conta o seguinte:
- Agrupar dados por visitante e visita: Use a ID de visitante concatenada (
post_visid_high
+post_visid_low
) juntamente comvisit_num
para agrupar ocorrências por visitas individuais. - Classificar ocorrências em cada visita: Classificar ocorrências cronologicamente usando
hit_time_gmt
ou outro indicador de sequência. - Identificar dimensão de entrada: Extraia o primeiro valor não vazio da coluna de prop desejada (
post_propX
) para cada visita como a dimensão de entrada. - Identificar dimensão de saída: Extraia o último valor não vazio da mesma coluna de prop (
post_propX
) para cada visita como a dimensão de saída. - Mesclar resultados, se necessário: Combine os resultados das dimensões de entrada e saída em um único conjunto de dados, garantindo que nenhuma duplicação ocorra no nível da visita.
Condições opcionais:
hit_source
: Para excluir dados sem carimbos de data/hora ou de determinadas fontes, inclua WHERE hit_source = 2.
exclude_hit
: o Analytics Workspace inclui apenas dados em que exclude_hit = 0. Inclua essa condição na query se desejar um resultado semelhante. Revise a tabela de referência da coluna Dados para ver os exclude_hit
valores adicionais.
post_page_event
: Para se concentrar nas exibições de página padrão e excluir ocorrências personalizadas, de download ou de link de saída, inclua post_page_event = 0.
Exemplo de consultas SQL:
Dimension de entrada:
SELECT
post_visid_high,
post_visid_low,
visit_num,
visit_start_time_gmt,
FIRST_VALUE(post_prop1 IGNORE NULLS) OVER (
PARTITION BY post_visid_high, post_visid_low, visit_num
ORDER BY hit_time_gmt
) AS entry_prop1
FROM your_data_feed_table
WHERE hit_source = '2'
AND exclude_hit ='0'
AND post_page_event = 0
Sair do Dimension:
SELECT
post_visid_high,
post_visid_low,
visit_num,
visit_start_time_gmt,
LAST_VALUE(post_prop1 IGNORE NULLS) OVER (
PARTITION BY post_visid_high, post_visid_low, visit_num
ORDER BY hit_time_gmt
ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING
) AS exit_prop1
FROM your_data_feed_table
WHERE hit_source = '2'
AND exclude_hit ='0'
AND post_page_event = 0
Exemplo de saída:
Visitor ID
Visit Num
Entry Prop1
Exit Prop1
view_article
browse_topic
startpage
escalation_request
Ao seguir essa abordagem, você deve ser capaz de derivar dimensões de entrada e saída de props em um feed de dados do Adobe Analytics.