Översikt över avancerad statistisk modellering med betrott flöde
Statistisk modellering används för att göra prognoser, upptäcka mönster och generera insikter från data. Detta gäller stora, högdimensionella datauppsättningar med komplexa strukturer på ett distribuerat sätt. Använd Data Distiller SQL-tillägget för att utnyttja statistiska modeller och omvandla rådata genom att förenkla och automatisera förbearbetningen av stora datauppsättningar på ett snabbt, parallellt och skalbart sätt.
Den här dokumentserien innehåller en omfattande guide om hur du använder Data Distiller SQL-tillägget för att utföra traditionella funktioner och maskininlärningsåtgärder i pålitligt flöde. Dessa dokument är utformade för att hjälpa dig att effektivt implementera och utnyttja SQL-baserad funktionsteknik, skapa SQL-baserade modeller och algoritmisk bearbetning. Dokumentationen vägleder dig genom de viktiga aspekter som behövs för att sömlöst integrera avancerad statistisk modellering i dina vanliga SQL-dataflöden.
Funktioner capabilities
Data Distiller ger er de verktyg ni behöver för att omvandla rådata till meningsfulla funktioner, bygga upp och utbilda statistiska modeller och använda dessa modeller för prediktiv analys. Dokumentationen är uppbyggd så att du kan förstå och använda dessa funktioner steg för steg:
-
Funktionskonstruktion: Lär dig hur du förbearbetar dina data genom att extrahera, omforma och välja de mest relevanta funktionerna. Lär dig mer om de tillgängliga SQL-funktionerna som förenklar och automatiserar funktionsprocessen och hur du ser till att dina data är optimalt förberedda för modellutbildning.
-
Modeller: Upptäck hur du hanterar, utvärderar och förutser framsteg i statistiska modeller med SQL. Förstå de kärnprocesser som ingår i SQL för att definiera livscykeln för dessa modeller i era datauppsättningar.
-
Algoritmer: Utforska de avancerade algoritmer för statistisk modellering som stöds av Data Distiller, inklusive klustring, klassificering och regression. I det här dokumentet beskrivs hur du använder tillgängliga algoritmer, deras parametrar och hur du genererar kundspecifika modeller med SQL-tillägg för att uppfylla dina affärsbehov.
Nästa steg
Läs dokumentet Feature Engineering om du vill lära dig hur du utför avancerade maskininlärningsåtgärder med Data Distiller-funktioner. Här beskrivs hur du omvandlar data till funktioner som är klara för modellering. Fortsätt sedan till dokumentet Models som vägleder dig genom processen att skapa, utbilda och hantera tillförlitliga modeller med de funktioner du har skapat. Utforska slutligen dokumentet Implementera avancerade statistiska modeller för att lära dig mer om de olika tillförlitliga modellerna som finns tillgängliga och hur du implementerar dem i dina SQL-arbetsflöden.