Información general sobre el modelado estadístico avanzado con Trusted Flow
El modelado estadístico se utiliza para hacer predicciones, detectar patrones y generar perspectivas a partir de datos. Esto se aplica a conjuntos de datos grandes y de alta dimensión con estructuras complejas de forma distribuida. Utilice la extensión SQL de Data Distiller para aprovechar los modelos estadísticos y transformar los datos sin procesar simplificando y automatizando el preprocesamiento de datos en grandes conjuntos de datos de forma oportuna, paralela y escalable.
Esta serie de documentos proporciona una guía completa sobre el uso de la extensión SQL de Data Distiller para realizar operaciones tradicionales de ingeniería de funciones y aprendizaje automático en un flujo de confianza. Estos documentos están diseñados para ayudarle a implementar y aprovechar de forma eficaz la ingeniería de funciones basada en SQL, la creación de modelos basados en SQL y el procesamiento algorítmico. La documentación le guía por los aspectos esenciales necesarios para integrar sin problemas el modelado estadístico avanzado en los flujos de trabajo de datos SQL normales.
Competencias capabilities
Data Distiller le proporciona las herramientas necesarias para transformar datos sin procesar en funciones significativas, crear y entrenar modelos estadísticos y utilizar estos modelos para el análisis predictivo. La documentación está organizada para ayudarle a comprender y aplicar estas capacidades paso a paso:
-
Ingeniería de características: Aprenda a preprocesar los datos extrayendo, transformando y seleccionando las características más relevantes. Obtenga información sobre las funciones SQL disponibles que simplifican y automatizan el proceso de ingeniería de funciones y cómo asegurarse de que los datos estén óptimamente preparados para la formación de modelos.
-
Modelos: Descubra cómo administrar, evaluar y predecir los modelos estadísticos de avances mediante SQL. Comprenda los procesos principales involucrados en SQL para definir el ciclo de vida de estos modelos en sus conjuntos de datos.
-
Algoritmos: explore los algoritmos de modelado estadístico avanzados que admite Data Distiller, incluidos los clústeres, la clasificación y la regresión. Este documento detalla el proceso para utilizar los algoritmos disponibles, sus parámetros y cómo generar modelos específicos del cliente utilizando la extensión SQL para satisfacer sus necesidades comerciales.
Pasos siguientes
Para aprender a realizar tareas sofisticadas de aprendizaje automático con las capacidades de Data Distiller, lea el documento Ingeniería de características. Describe cómo transformar los datos en funciones listas para ser modeladas. A continuación, continúe con el documento Modelos, que le guiará a través del proceso de creación, formación y administración de modelos de confianza mediante las funciones que ha diseñado. Por último, explore el Documento sobre la implementación de modelos estadísticos avanzados para obtener información sobre los distintos modelos de confianza disponibles y cómo implementarlos en los flujos de trabajo de SQL.