Resolução de problemas de identificação de prop de Entrada/Saída no Adobe Analytics

Os valores de prop de entrada e saída nos feeds de dados do Adobe Analytics não são rotulados explicitamente, o que pode tornar a análise no nível da visita mais complexa. Se estiver tentando entender como extrair essas dimensões de dados brutos, este artigo fornece um método claro para obtê-las usando identificadores de visita e carimbos de data e hora. Ao isolar o primeiro e o último valor de um determinado post_propX, é possível reconstruir as dimensões de entrada e saída para obter relatórios mais precisos.

Descrição description

Ambiente

Adobe Analytics

Problema/Sintomas

As dimensões de prop de entrada e saída não são rotuladas explicitamente como Entrada ou Saída nos feeds de dados do Adobe, mas são derivadas da coluna post_propX. Para determinar qual prop foi acionado na entrada e qual na saída, isole os valores primeiro (Entrada) e último (Saída) da prop para cada visita. Isso requer o processamento de dados brutos usando informações de visita e nível de ocorrência.

Resolução resolution

Como os valores de prop de entrada e saída não são rotulados diretamente nos feeds de dados do Adobe Analytics, você precisa derivá-los processando os dados brutos. Isso envolve agrupar ocorrências por visita, classificá-las cronologicamente e identificar o primeiro e o último valores não vazios da coluna post_propX relevante. As etapas abaixo descrevem como abordar isso usando SQL ou ferramentas semelhantes.

  • Colunas principais para identificação de visitas:

    • post_visid_high e post_visid_low: concatene-os para identificar visitantes únicos.
    • visit_num: Identifica o número da visita de um visitante.
    • visit_page_num: a dimensão Profundidade da ocorrência. Incrementa em 1 para cada ocorrência que o visitante gera e redefine com cada visita.
    • visit_start_time_gmt: carimbo de data e hora (em horário UNIX) quando os servidores de coleta de dados da Adobe receberam a ocorrência.
    • hit_time_gmt: Carimbo de data e hora (em horário UNIX) quando os servidores de coleta de dados da Adobe receberam a ocorrência, expresso em horário UNIX.

Para derivar as dimensões de Entrada e Saída de um feed de dados, processe os dados brutos (por exemplo, usando uma ferramenta como Python, SQL ou R) para identificar o primeiro e o último valores de prop para cada visita. A query precisaria levar em conta o seguinte:

  • Agrupar dados por visitante e visita: Use a ID de visitante concatenada (post_visid_high + post_visid_low) juntamente com visit_num para agrupar ocorrências por visitas individuais.
  • Classificar ocorrências em cada visita: Classificar ocorrências cronologicamente usando hit_time_gmt ou outro indicador de sequência.
  • Identificar dimensão de entrada: Extraia o primeiro valor não vazio da coluna de prop desejada (post_propX) para cada visita como a dimensão de entrada.
  • Identificar dimensão de saída: Extraia o último valor não vazio da mesma coluna de prop (post_propX) para cada visita como a dimensão de saída.
  • Mesclar resultados, se necessário: Combine os resultados das dimensões de entrada e saída em um único conjunto de dados, garantindo que nenhuma duplicação ocorra no nível da visita.

Condições opcionais:

hit_source: Para excluir dados sem carimbos de data/hora ou de determinadas fontes, inclua WHERE hit_source = 2.

exclude_hit: o Analytics Workspace inclui apenas dados em que exclude_hit = 0. Inclua essa condição na query se desejar um resultado semelhante. Revise a tabela de referência da coluna Dados para ver os exclude_hit valores adicionais.

post_page_event: Para se concentrar nas exibições de página padrão e excluir ocorrências personalizadas, de download ou de link de saída, inclua post_page_event = 0.

Exemplo de consultas SQL:

Dimension de entrada:

SELECT
   post_visid_high,
   post_visid_low,
   visit_num,
   visit_start_time_gmt,
   FIRST_VALUE(post_prop1 IGNORE NULLS) OVER (
       PARTITION BY post_visid_high, post_visid_low, visit_num
       ORDER BY hit_time_gmt
   ) AS entry_prop1
FROM your_data_feed_table
WHERE hit_source = '2'
  AND exclude_hit ='0'
  AND post_page_event = 0

Sair do Dimension:

SELECT
   post_visid_high,
   post_visid_low,
   visit_num,
   visit_start_time_gmt,
   LAST_VALUE(post_prop1 IGNORE NULLS) OVER (
       PARTITION BY post_visid_high, post_visid_low, visit_num
       ORDER BY hit_time_gmt
       ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING
   ) AS exit_prop1
FROM your_data_feed_table
WHERE hit_source = '2'
AND exclude_hit ='0'
AND post_page_event = 0

Exemplo de saída:

Visitor ID
Visit Num
Entry Prop1
Exit Prop1
xxxx
x
view_article
browse_topic
xxxx
x
startpage
escalation_request

Ao seguir essa abordagem, você deve ser capaz de derivar dimensões de entrada e saída de props em um feed de dados do Adobe Analytics.

recommendation-more-help
3d58f420-19b5-47a0-a122-5c9dab55ec7f