Mehr über die Data Workbench Mitteilung zum Ende der Nutzungsdauer.
Mit dem Besucher-Clustering können Sie Kundenmerkmale nutzen, um Besucher dynamisch zu kategorisieren und basierend auf ausgewählten Dateneingaben Cluster-Sets zu generieren, um Gruppen zu identifizieren, die ähnliche Interessen und Verhaltensweisen für die Kundenanalyse und das Targeting haben.
Clustering-Prozess
Der Clustering-Prozess erfordert, dass Sie Metriken und Dimensionselemente identifizieren, die als Eingaben verwendet werden sollen, und Sie können eine bestimmte Zielpopulation auswählen, um diese Elemente auf die Erstellung spezifizierter Cluster anzuwenden. Wenn Sie den Clustering-Prozess ausführen, verwendet das System die Eingabe von Metriken und Dimensionen, um geeignete Anfangszentren für die angegebene Anzahl von Clustern zu bestimmen. Diese Zentren werden dann als Ausgangspunkt für die Anwendung des K-Means-Algorithmus verwendet.
Die Maximum Iterations im Options -Menü kann der Analyst die maximale Anzahl der Iterationen angeben, die vom Clustering-Algorithmus ausgeführt werden sollen. Die Festlegung dieser Option kann zu einer schnelleren Fertigstellung des Clustering-Prozesses auf der Grundlage der maximalen Iterationsbegrenzung auf Kosten der exakten Konvergenz der Cluster-Zentren führen.
Sobald die Cluster definiert wurden, kann die Cluster-Dimension wie jede andere Dimension zur Verwendung gespeichert werden. Es kann auch in den Cluster Explorer geladen werden, um die Trennung von Cluster-Zentren zu untersuchen.
Im Cluster Builder können Sie Options > Algorithm , um beim Definieren von Clustern Algorithmen auszuwählen. Derzeit werden drei Algorithmen unterstützt:
++
Es gibt 2 Möglichkeiten, den Clustering-Prozess auszuführen:
Der Algorithmus weist die folgenden Einschränkungen auf:
Im DPU.cfg -Datei, wird der Wert für "Abfrage, Speicherbegrenzung"standardmäßig auf 500 MB festgelegt. Dieser Wert muss erhöht werden, während mehrere Clustering-Aufträge ausgeführt werden. Wenn Sie beispielsweise 5 Clustering-Aufträge parallel ausführen, erhöhen Sie diesen Wert auf 1 GB. Es gibt keine Möglichkeit, den Clustering-Auftrag abzubrechen, ohne den Server neu zu starten.
Empfehlungen
Die Anzahl der Iterationen (Häufigkeit, mit der die Daten gescannt werden) und die Konvergenzschwelle, die Sie konfigurieren, wirken sich grob auf die Clustering-Performance aus. Die folgende Tabelle enthält eine umfassendere Richtlinie, die Sie befolgen können:
Anzahl der Cluster | Algorithmus | Iterationen | Konvergenzschwellenwert | Normalisierung |
---|---|---|---|---|
6 | Kbedeutet | 25,50 | 1e-3 | Min.-Max |
6 | Kbedeutet | 25,50 | 1e-6 | Min.-Max |
6 | Kbedeutet+ | 50 | 1e-6 | Min.-Max |