Übersicht über die erweiterte statistische Modellierung mit Trusted Flow
Die statistische Modellierung wird verwendet, um Vorhersagen zu treffen, Muster zu erkennen und Erkenntnisse aus Daten zu generieren. Dies gilt für große, hochdimensionale Datensätze mit komplexen Strukturen in verteilter Weise. Verwenden Sie die Data Distiller SQL-Erweiterung, um Statistikmodelle zu nutzen und Rohdaten umzuwandeln, indem Sie die Vorverarbeitung großer Datensätze zeitnah, parallel und skalierbar vereinfachen und automatisieren.
Diese Dokumentreihe bietet eine umfassende Anleitung zur Verwendung der Data Distiller SQL-Erweiterung, um herkömmliche Funktionen und maschinelle Lernvorgänge für Trusted Flow durchzuführen. Diese Dokumente sollen Ihnen dabei helfen, SQL-basiertes Feature Engineering, SQL-basierte Modellerstellung und algorithmische Verarbeitung effektiv zu implementieren und zu nutzen. Die Dokumentation führt Sie durch die kritischen Aspekte, die für die nahtlose Integration der erweiterten statistischen Modellierung in Ihre regulären SQL-Daten-Workflows erforderlich sind.
Funktionen capabilities
Data Distiller bietet die erforderlichen Tools, um Rohdaten in aussagekräftige Funktionen umzuwandeln, statistische Modelle zu erstellen und zu trainieren und diese Modelle für die prädiktive Analyse zu verwenden. Die Dokumentation soll Ihnen dabei helfen, diese Funktionen Schritt für Schritt zu verstehen und anzuwenden:
-
Feature Engineering: Erfahren Sie, wie Sie Ihre Daten vorverarbeiten können, indem Sie die relevantesten Funktionen extrahieren, transformieren und auswählen. Erfahren Sie mehr über die verfügbaren SQL-Funktionen, die den Feature Engineering-Prozess vereinfachen und automatisieren, und wie Sie sicherstellen können, dass Ihre Daten optimal für das Modell-Training vorbereitet sind.
-
Modelle: Erfahren Sie, wie Sie mit SQL fortschrittliche statistische Modelle verwalten, auswerten und vorhersagen können. Machen Sie sich mit den in SQL involvierten Kernprozessen vertraut, um den Lebenszyklus dieser Modelle für Ihre Datensätze zu definieren.
-
Algorithmen: Informieren Sie sich über die erweiterten Algorithmen für die statistische Modellierung, die von Data Distiller unterstützt werden, einschließlich Clustering, Klassifizierung und Regression. In diesem Dokument wird der Prozess zur Verwendung verfügbarer Algorithmen, ihre Parameter und die Erstellung kundenspezifischer Modelle mithilfe der SQL-Erweiterung für Ihre Geschäftsanforderungen beschrieben.
Nächste Schritte
Informationen zum Ausführen komplexer maschineller Lernaufgaben mit Data Distiller-Funktionen finden Sie im Dokument Feature Engineering. Es wird beschrieben, wie Sie Ihre Daten in Funktionen umwandeln, die für die Modellierung bereit sind. Fahren Sie anschließend mit dem Dokument Modelle fort, das Sie durch den Prozess der Erstellung, Schulung und Verwaltung vertrauenswürdiger Modelle mithilfe der von Ihnen entwickelten Funktionen führt. Lesen Sie abschließend das Dokument Implementieren erweiterter statistischer Modelle, um mehr über die verschiedenen verfügbaren vertrauenswürdigen Modelle zu erfahren und darüber, wie Sie sie in Ihren SQL-Workflows implementieren.