Creación de clústeres

Seleccione las variables de entrada, el número de clústeres y una población objetivo (si lo desea) para definir clústeres en el conjunto de datos.

Creación de clústeres

  1. Abra el Cluster Builder.

    Haga clic en Visualización > Análisis predictivo > Clúster > Generador de clústeres.

  2. Seleccione las variables de entrada.

    • Agregue métricas a la lista Input Variables seleccionando en el menú Metric de la barra de herramientas.

    • Agregue elementos de dimensión a la lista Input Variables arrastrándolos desde una tabla de Dimension.

      Pulse Ctrl + Alt y arrastre los elementos de dimensión seleccionados a la lista Input Variables o al cuadro Element de la barra de herramientas.


      De forma predeterminada, la agrupación en clúster se realiza en todo el conjunto de datos. Puede ver todas las variables de entrada en el panel izquierdo Preprocessing.

  3. Utilice el menú Options para seleccionar el número deseado de clústeres.

  4. Si desea agrupar un subconjunto de los Visitantes en el conjunto de datos, puede definir un Filtro de población.

    Comience definiendo el subconjunto deseado mediante selecciones en el espacio de trabajo o utilizando el Filter Editor. Una vez que haya seleccionado el subconjunto deseado, establezca la población objetivo en el menú Options . Se recomienda asignar un nombre de identificación al grupo de destino.

    El menú Options también tiene una configuración para controlar el número máximo de pasadas y el umbral aceptable para la convergencia central.

  5. Una vez configuradas las entradas y las opciones, haga clic en el botón Go para ejecutar la agrupación localmente o presione Submit para enviar la tarea al servidor de Predictive Analytics. Los envíos al servidor guardarán la dimensión resultante en el conjunto de datos cuando se complete la convergencia.

    Cuando se ejecuta localmente, verá que el Generador de clústeres se mueve a través de cuatro etapas de agrupación en clúster en canopy, ya que define centros inteligentes basados en las entradas.

    Una vez que los centros de los clústeres dejan de cambiar más del umbral de convergencia especificado, el Dimension de clúster se convierte y el Generador de clústeres muestra información adicional sobre la relevancia de una entrada para cada clúster.

  6. Personalice los clústeres.

    Al hacer clic con el botón derecho en la barra de color de las estadísticas, se abre un menú contextual que le permite personalizar los umbrales de relevancia y, en el caso de las distribuciones de elementos de dimensión, elegir qué prueba se muestra.

    Las entradas de métricas proporcionan una prueba t para cada clúster, mientras que las entradas de elementos de dimensión proporcionan tres pruebas de distribución (Chi al cuadrado, una estadística U de entropía y la estadística V de Cramer) para cada clúster.

    NOTA

    Si agrega o elimina entradas durante la convergencia, el proceso se pausará hasta que vuelva a presionar Go.

    Después de crear clústeres, puede abrir el selector de color para asignar colores a diferentes resultados de distribución.

  7. Con el Dimension de clúster convergido, puede agregar métricas a la tabla y realizar las selecciones normales. También puede hacer clic con el botón derecho en los nombres de elementos (Cluster 1, Cluster 2, etc.) para abrir el menú contextual y cambiarles el nombre por otro más significativo.

  8. Si desea utilizar esta dimensión de clúster en otras visualizaciones, puede Save hacerlo localmente o Submit hacerlo en el servidor.

Si desea volver a ejecutar la convergencia o ver la relevancia de las entradas, el Generador de clústeres también puede cargar las dimensiones de clúster existentes.

SUGERENCIA

Cuando esté seleccionado, Reset lanzará completamente todas las variables de entrada y le proporcionará una visualización en blanco del generador de clústeres para definir nuevos clústeres.

En esta página