Besucher-Clustering

WICHTIG

Mehr über die Data Workbench Mitteilung zum Ende der Nutzungsdauer.

Mit dem Besucher-Clustering können Sie Kundenmerkmale nutzen, um Besucher dynamisch zu kategorisieren und basierend auf ausgewählten Dateneingaben Cluster-Sets zu generieren, um Gruppen zu identifizieren, die ähnliche Interessen und Verhaltensweisen für die Kundenanalyse und das Targeting haben.

Clustering-Prozess

Der Clustering-Prozess erfordert, dass Sie Metriken und Dimensionselemente identifizieren, die als Eingaben verwendet werden sollen, und Sie können eine bestimmte Zielpopulation auswählen, um diese Elemente auf die Erstellung spezifizierter Cluster anzuwenden. Wenn Sie den Clustering-Prozess ausführen, verwendet das System die Eingabe von Metriken und Dimensionen, um geeignete Anfangszentren für die angegebene Anzahl von Clustern zu bestimmen. Diese Zentren werden dann als Ausgangspunkt für die Anwendung des K-Means-Algorithmus verwendet.

  • Die ersten Zentren werden mithilfe eines Canopy-Clustering-Passes intelligent ausgewählt.
  • Datencluster werden erstellt, indem jeder Datenpunkt dem nächstgelegenen Zentrum zugeordnet wird.
  • Der Mittelwert jedes K-Clusters wird zum neuen Zentrum.
  • Der Algorithmus wird in den Schritten 2 und 3 wiederholt, bis die Konvergenz erreicht ist. Das kann mehrere Durchgänge dauern.

Die Maximum Iterations im Options -Menü kann der Analyst die maximale Anzahl der Iterationen angeben, die vom Clustering-Algorithmus ausgeführt werden sollen. Die Festlegung dieser Option kann zu einer schnelleren Fertigstellung des Clustering-Prozesses auf der Grundlage der maximalen Iterationsbegrenzung auf Kosten der exakten Konvergenz der Cluster-Zentren führen.

HINWEIS

Sobald die Cluster definiert wurden, kann die Cluster-Dimension wie jede andere Dimension zur Verwendung gespeichert werden. Es kann auch in den Cluster Explorer geladen werden, um die Trennung von Cluster-Zentren zu untersuchen.

Im Cluster Builder können Sie Options > Algorithm , um beim Definieren von Clustern Algorithmen auszuwählen. Derzeit werden drei Algorithmen unterstützt:

  • KMeans
  • Kbedeutet++
  • Maximierung der Erwartungen

Es gibt 2 Möglichkeiten, den Clustering-Prozess auszuführen:

  • Methode 1 - Klicken Go im Visualisierungsfenster des Clusters.
  • Methode 2 - Klicken Submit im Fenster der Clustervisualisierung, das den Clustering-Auftrag direkt an den Server sendet. Sie können den Fortschritt über die Option "Detaillierter Status für Abfrage"verfolgen.

Der Algorithmus weist die folgenden Einschränkungen auf:

  1. Wenn Sie Methode 1 verwenden, können Sie einen der unterstützten Clustering-Algorithmen auswählen.
  2. Wenn Sie Methode 2 verwenden, können Sie kmittel oder kmittel++ auswählen. Die Option zur Maximierung der Erwartungen ist nicht verfügbar.
HINWEIS

Im DPU.cfg -Datei, wird der Wert für "Abfrage, Speicherbegrenzung"standardmäßig auf 500 MB festgelegt. Dieser Wert muss erhöht werden, während mehrere Clustering-Aufträge ausgeführt werden. Wenn Sie beispielsweise 5 Clustering-Aufträge parallel ausführen, erhöhen Sie diesen Wert auf 1 GB. Es gibt keine Möglichkeit, den Clustering-Auftrag abzubrechen, ohne den Server neu zu starten.

Empfehlungen

Die Anzahl der Iterationen (Häufigkeit, mit der die Daten gescannt werden) und die Konvergenzschwelle, die Sie konfigurieren, wirken sich grob auf die Clustering-Performance aus. Die folgende Tabelle enthält eine umfassendere Richtlinie, die Sie befolgen können:

Anzahl der Cluster Algorithmus Iterationen Konvergenzschwellenwert Normalisierung
6 Kbedeutet 25,50 1e-3 Min.-Max
6 Kbedeutet 25,50 1e-6 Min.-Max
6 Kbedeutet+ 50 1e-6 Min.-Max

Auf dieser Seite