Amostragem de dados e taxas de erro em alguns relatórios do Audience Manager

Um resumo da metodologia de amostragem utilizada para alguns relatórios, taxas de erro de amostragem e uma lista de relatórios que retornam informações com base em dados recolhidos.

Taxa de amostragem de dados

Alguns relatórios Audience Manager exibem resultados com base em um conjunto de amostras da quantidade total de dados disponíveis. A proporção de dados amostrados é de 1:54. Para relatórios que usam dados de amostra, isso significa que seus resultados se baseiam em 1 registro de cada conjunto de 54 registros.

Esses relatórios usam dados estatísticos de amostra porque precisam de uma grande quantidade de poder de computação para gerar resultados. A amostragem ajuda a equilibrar as demandas computacionais reduzidas, mantendo o desempenho do sistema e fornecendo resultados precisos.

Taxas de erro

Erros podem ocorrer em relatórios que geram dados de sobreposição. Um erro é definido como a porcentagem de registros que:

  • Não deveria ter sido incluído em um relatório, mas sim adicionado mesmo assim.
  • Deveria ter sido incluído em um relatório, mas foi deixado de fora.

É importante observar que nossos testes e modelos mostram que a taxa de erro diminui em uma proporção inversa ao número de registros em seu conjunto de dados. Os conjuntos de dados com muitos registros geram menos erros do que os conjuntos com um pequeno número de registros. Vejamos essa afirmação de forma mais quantitativa. Conforme mostrado na tabela a seguir, para um número definido de registros, 95% dos resultados do relatório estarão abaixo de uma taxa de erro específica.

Número de registros Taxa de erro
500 - 1.000 95% estão abaixo de uma taxa de erro de 42%.
1.000 - 1.500 95% estão abaixo de uma taxa de erro de 34%.
10.000 - 50.000 95% estão abaixo de uma taxa de erro de 14%.
50.000 95% estão abaixo de uma taxa de erro de 6%.
100 000 95% estão abaixo de uma taxa de erro de 4%.
500.000 (ou mais) 95% estão abaixo de uma taxa de erro de 2%.

Utilização da metodologia de amostragem Minhash

Com base na metodologia de amostragem Minhash, o Audience Manager usa um novo método para calcular os estimadores de características e segmentos sobre um rascunho de dados de um hash de permutação única. Esse novo método produz uma variância menor do que o estimador padrão para similaridade com o Jaccard. Consulte a seção abaixo para obter os relatórios que usam essa metodologia.

Relatórios que usam dados de amostra

Os relatórios Audience Manager que usam dados estatísticos amostrados e a metodologia de amostragem Minhash incluem:

Amostragem estatística Metodologia de amostragem de minhash
Dados de público-alvo endereçáveis (dados no nível do cliente e do segmento). Relatórios de sobreposição (característica para característica, segmento para característica e segmento para segmento)
A métrica Total Devices para Profile Merge Rule. Recomendações de característica
O Data Explorer usa dados de amostra na Search guia e qualquer Saved Searches Audience Marketplace Recommendations

Nesta página

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now