O agrupamento de visitantes permite que você aproveite as características do cliente para categorizar dinamicamente os visitantes e gerar conjuntos de clusters com base em entradas de dados selecionadas, identificando grupos que têm interesses e comportamentos semelhantes para análise e direcionamento do cliente.
Processo de agrupamento
O processo de agrupamento exige que você identifique métricas e elementos de dimensão para usar como entradas e permite que você escolha uma população-alvo específica para aplicar esses elementos para criar clusters especificados. Quando você executa o processo de agrupamento, o sistema usa a métrica e as entradas de dimensão para determinar os centros iniciais apropriados para o número especificado de clusters. Esses centros são então usados como ponto de partida para aplicar o algoritmo K-Means.
O Maximum Iterations Options menu permite que o analista especifique o número máximo de iterações a serem executadas pelo algoritmo de agrupamento. Definir essa opção pode resultar em uma conclusão mais rápida do processo de agrupamento com base no limite máximo de iterações, em detrimento da convergência exata dos centros de cluster.
Depois que os clusters forem definidos, a Dimensão de Cluster poderá ser salva para uso como qualquer outra dimensão. Ele também pode ser carregado no Cluster Explorer para examinar a separação dos centros de cluster.
No Construtor de cluster, você pode selecionar Options > Algorithm para selecionar algoritmos ao definir clusters. Atualmente, há três algoritmos suportados:
++
Há duas maneiras de executar o processo de agrupamento:
O algoritmo tem as seguintes restrições:
No DPU.cfg arquivo, o valor para "Consulta, Limite de Memória" é definido como 500 MB por padrão. Esse valor deve ser aumentado ao executar vários trabalhos de cluster. Por exemplo, se você estiver executando 5 trabalhos de cluster em paralelo, aumente esse valor para 1 GB. Não há como cancelar o trabalho de agrupamento sem reiniciar o Servidor.
Recomendações
O número de iterações (número de vezes que os dados são digitalizados) e o limite de convergência que você configura afetam grosseiramente o desempenho do agrupamento. A tabela a seguir fornece uma orientação mais ampla que você pode seguir:
Número de clusters | Algoritmo | Iterações | Limite de convergência | Normalização |
---|---|---|---|---|
6 | Kays | 25,50 | 1e-3 | Mín. máx. |
6 | Kays | 25,50 | 1e-6 | Mín. máx. |
6 | KSignifica++ | 50 | 1e-6 | Mín. máx. |