Detecção de anomalias anomaly-detection
A Detecção de anomalias utiliza um modelo estatístico para encontrar automaticamente tendências inesperadas em seus dados. O modelo analisa métricas e determina um limite inferior, um limite superior e o intervalo esperado de valores. Quando ocorrer um pico ou uma queda inesperada, o sistema irá alertá-lo no relatório.
Exemplos de anomalias que você pode investigar incluem:
- Quedas drásticas no valor médio de pedido
- Picos em pedidos com receita baixa
- Picos ou quedas em registros de avaliação
- Quedas em visualizações da página inicial
- Junções em eventos de buffer de vídeo
- Picos em taxas de vídeo baixas
Métricas para a detecção de anomalias
A detecção de anomalias adiciona novos valores de métrica a cada métrica selecionada, incluindo:
Nível mais baixo do intervalo de previsão. Valores abaixo deste nível serão considerados anômalos.
Representa uma confiança de 95% de que os valores estarão acima deste nível.
Nível mais alto do intervalo de previsão. Valores acima deste nível são considerados anômalos.
Representa uma confiança de 95% de que os valores estarão abaixo deste nível.
O Report Builder aplica esses valores às métricas selecionadas. Por exemplo, se você selecionar uma métrica de Exibições de página e aplicar a detecção de anomalias, será usada uma métrica Page Views Lower Bound
.
Como a detecção de anomalias é calculada
A detecção de anomalias utiliza um período de treinamento para calcular, aprender e relatar os dados de previsão de intervalo por dia. Este período de treinamento é o período histórico que identifica aquilo que é normal e aquilo que é anômalo, e aplica o que aprendeu ao período do relatório. Em relatórios de marketing, estão disponíveis os períodos de treinamento de 30, 60 e 90 dias. No Report Builder, estão disponíveis 30 dias.
O período de treinamento não é necessariamente o mesmo que o período do relatório selecionado. Um gráfico do relatório exibe o intervalo de datas especificado no calendário.
Para calcular os dados, compara-se o total diário de cada métrica ao seu período de treinamento, usando cada um dos seguintes algoritmos:
- Multiplicativo de Holt Winters (Suavização exponencial tripla)
- Aditivo de Holt Winters (Suavização exponencial tripla)
- Tendência de Holts corrigida (Suavização exponencial dupla)
Cada algoritmo é aplicado para determinar aquele com a menor Soma de erros ao quadrado (ou SSE em inglês). O Erro de porcentagem da média absoluta (MAPE, em inglês) e o Erro padrão atual são calculados para garantir que o modelo seja estatisticamente válido.
Esses algoritmos podem ser ampliados para fornecem previsões das métricas em períodos do futuro.
Como o período de treinamento pode variar por conta do início do período do relatório, é possível que haja diferenças entre os dados de uma mesma data relatados como parte de dois períodos diferentes.
Por exemplo, se você executar um relatório para o intervalo de datas de 1 a 14 de janeiro e logo depois um relatório para o intervalo de 7 a 21 de janeiro, você verá dados de previsão diferentes para uma mesma métrica entre os dias 7 a 14 de janeiro nos dois relatórios. Isso acontece devido à diferença entre os períodos de treinamento.