Um resumo da metodologia de amostragem utilizada para alguns relatórios, taxas de erro de amostragem e uma lista de relatórios que retornam informações com base em dados recolhidos.
Alguns relatórios Audience Manager exibem resultados com base em um conjunto amostrado da quantidade total de dados disponíveis. A proporção de dados amostrada é de 1:54. Para relatórios que usam dados de amostra, seus resultados são baseados em 1 registro de cada conjunto de 54 registros.
Esses relatórios usam dados estatísticos de amostra porque eles precisam de uma grande quantidade de poder de computação para gerar resultados. A amostragem ajuda a equilibrar as demandas computacionais reduzidas, mantendo o desempenho do sistema e fornecendo resultados precisos.
Erros podem ocorrer em relatórios que geram dados de sobreposição. Um erro é definido como a porcentagem de registros que:
É importante observar que nossos testes e modelos mostram que a taxa de erro diminui em uma proporção inversa ao número de registros no conjunto de dados. Conjuntos de dados com muitos registros geram menos erros que conjuntos com um pequeno número de registros. Vejamos essa afirmação de forma mais quantitativa. Como mostrado na tabela a seguir, para um número definido de registros, 95% dos resultados do relatório estarão abaixo de uma taxa de erro específica.
Número de registros | Taxa de erro |
---|---|
500 - 1.000 | 95% estão abaixo de uma taxa de erro de 42%. |
1.000 - 1.500 | 95% estão abaixo de uma taxa de erro de 34%. |
10.000 - 50.000 | 95% estão abaixo de uma taxa de erro de 14%. |
50.000 | 95% estão abaixo de uma taxa de erro de 6%. |
100.000 | 95% estão abaixo de uma taxa de erro de 4%. |
500.000 (ou mais) | 95% estão abaixo de uma taxa de erro de 2%. |
Com base na metodologia de amostragem Minhash, o Audience Manager usa um novo método para calcular estimativas de características e segmentos sobre um rascunho de dados de hash de uma permutação. Esse novo método produz uma variação menor do que o estimador padrão da similaridade Jaccard. Consulte a seção abaixo para obter os relatórios que usam essa metodologia.
Os relatórios Audience Manager que usam dados estatísticos amostrados e a metodologia de amostragem de Minhash incluem:
Amostragem estatística | Metodologia de amostragem de minhash |
---|---|
Dados de público-alvo endereçáveis (dados a nível de cliente e segmento). | Relatórios de sobreposição (característica, segmento para característica e segmento para segmento) |
A métrica Total de dispositivos para um Profile Merge Rule. | Recomendações de característica |
O Data Explorer usa dados de amostra na Search guia e em qualquer Saved Searches | Audience Marketplace Recommendations |