Amostragem de dados e taxas de erro em alguns relatórios do Audience Manager

Um resumo da metodologia de amostragem utilizada para alguns relatórios, taxas de erro de amostragem e uma lista de relatórios que retornam informações com base em dados recolhidos.

Proporção de amostragem de dados

Alguns relatórios Audience Manager exibem resultados com base em um conjunto amostrado da quantidade total de dados disponíveis. A proporção de dados amostrada é de 1:54. Para relatórios que usam dados de amostra, seus resultados são baseados em 1 registro de cada conjunto de 54 registros.

Esses relatórios usam dados estatísticos de amostra porque eles precisam de uma grande quantidade de poder de computação para gerar resultados. A amostragem ajuda a equilibrar as demandas computacionais reduzidas, mantendo o desempenho do sistema e fornecendo resultados precisos.

Taxas de erro

Erros podem ocorrer em relatórios que geram dados de sobreposição. Um erro é definido como a porcentagem de registros que:

  • Não deveria ter sido incluído num relatório, mas sim adicionado.
  • Deveria ter sido incluído em um relatório, mas foi deixado de fora.

É importante observar que nossos testes e modelos mostram que a taxa de erro diminui em uma proporção inversa ao número de registros no conjunto de dados. Conjuntos de dados com muitos registros geram menos erros que conjuntos com um pequeno número de registros. Vejamos essa afirmação de forma mais quantitativa. Como mostrado na tabela a seguir, para um número definido de registros, 95% dos resultados do relatório estarão abaixo de uma taxa de erro específica.

Número de registros Taxa de erro
500 - 1.000 95% estão abaixo de uma taxa de erro de 42%.
1.000 - 1.500 95% estão abaixo de uma taxa de erro de 34%.
10.000 - 50.000 95% estão abaixo de uma taxa de erro de 14%.
50.000 95% estão abaixo de uma taxa de erro de 6%.
100.000 95% estão abaixo de uma taxa de erro de 4%.
500.000 (ou mais) 95% estão abaixo de uma taxa de erro de 2%.

Usando a metodologia de amostragem de minhash

Com base na metodologia de amostragem Minhash, o Audience Manager usa um novo método para calcular estimativas de características e segmentos sobre um rascunho de dados de hash de uma permutação. Esse novo método produz uma variação menor do que o estimador padrão da similaridade Jaccard. Consulte a seção abaixo para obter os relatórios que usam essa metodologia.

Relatórios que usam dados de amostra

Os relatórios Audience Manager que usam dados estatísticos amostrados e a metodologia de amostragem de Minhash incluem:

Amostragem estatística Metodologia de amostragem de minhash
Dados de público-alvo endereçáveis (dados a nível de cliente e segmento). Relatórios de sobreposição (característica, segmento para característica e segmento para segmento)
A métrica Total de dispositivos para um Profile Merge Rule. Recomendações de característica
O Data Explorer usa dados de amostra na Search guia e em qualquer Saved Searches Audience Marketplace Recommendations

Nesta página