En savoir plus sur le Data Workbench Annonce de fin de vie.
La mise en grappe des visiteurs vous permet d’exploiter les caractéristiques des clients afin de classer dynamiquement les visiteurs et de générer des ensembles de clusters en fonction d’entrées de données sélectionnées, afin d’identifier les groupes ayant des intérêts et des comportements similaires pour l’analyse et le ciblage des clients.
Processus de mise en grappe
Le processus de mise en grappe nécessite l’identification des mesures et des éléments de dimension à utiliser comme entrées et vous permet de choisir une population cible spécifique à laquelle appliquer ces éléments pour créer des grappes spécifiées. Lorsque vous exécutez le processus de mise en grappe, le système utilise les entrées de mesure et de dimension pour déterminer les centres initiaux appropriés pour le nombre spécifié de grappes. Ces centres sont ensuite utilisés comme point de départ pour appliquer l’algorithme K-Means.
Le Maximum Iterations dans le Options permet à l’analyste de spécifier le nombre maximal d’itérations à effectuer par l’algorithme de mise en grappe. Si vous définissez cette option, le processus de mise en grappe peut être plus rapide en fonction du plafond d’itérations maximal, au détriment de la convergence exacte des centres de la grappe.
Une fois les clusters définis, la Dimension de clusters peut être enregistrée pour être utilisée comme toute autre dimension. Il peut également être chargé dans l’Explorateur de clusters pour examiner la séparation des centres de clusters.
Dans le Créateur de clusters, vous pouvez sélectionner Options > Algorithm pour sélectionner des algorithmes lors de la définition de grappes. Actuellement, 3 algorithmes sont pris en charge :
++
Il existe deux façons d’exécuter le processus de mise en grappe :
L’algorithme présente les restrictions suivantes :
Dans le DPU.cfg , la valeur de "Requête, Limite de mémoire" est définie sur 500 Mo par défaut. Cette valeur doit être augmentée lors de l’exécution de plusieurs tâches de mise en grappe. Par exemple, si vous exécutez 5 tâches de mise en grappe en parallèle, augmentez cette valeur à 1 Go. Il n’existe aucun moyen d’annuler la tâche de mise en grappe sans redémarrer le serveur.
Recommandations
Le nombre d’itérations (nombre de fois où les données sont analysées) et le seuil de convergence que vous configurez affectent grossièrement les performances de la mise en grappe. Le tableau suivant fournit une ligne directrice plus large que vous pouvez suivre :
Nombre de clusters | Algorithme | Itérations | Seuil de convergence | Normalisation |
---|---|---|---|---|
6 | Keans | 25 500 | 1e-3 | Min. max. |
6 | Keans | 25 500 | 1e-6 | Min. max. |
6 | Keans++ | 50 | 1e-6 | Min. max. |