使用可信流进行高级统计建模概述
AVAILABILITY
此功能适用于购买了Data Distiller附加产品的客户。 有关更多信息,请与您的 Adobe 代表联系。
统计建模用于根据数据做出预测、检测模式和生成见解。 这适用于以分布式方式具有复杂结构的大型、高维数据集。 使用Data Distiller SQL扩展以及时、并行和可伸缩的方式简化和自动化大型数据集上的数据预处理,从而利用统计模型并转换原始数据。
本系列文档提供了有关如何使用Data Distiller SQL扩展对可信流执行传统功能工程和机器学习操作的全面指南。 这些文档旨在帮助您有效地实施和利用基于SQL的功能工程、基于SQL的模型创建和算法处理。 该文档将指导您完成无缝地将高级统计建模集成到常规SQL数据工作流中所需的关键方面。
功能 capabilities
数据Distiller为您提供了将原始数据转换为有意义的功能、构建和训练统计模型以及使用这些模型进行预测分析所需的工具。 本文档旨在帮助您逐步了解并应用这些功能:
-
功能工程:了解如何通过提取、转换和选择最相关的功能来预处理数据。 了解可简化和自动化特征工程过程的可用SQL函数,以及如何确保以最佳方式准备数据以进行模型训练。
-
模型:了解如何使用SQL管理、评估和预测高级统计模型。 了解SQL中涉及的核心进程,以定义数据集上这些模型的生命周期。
-
算法:探索Data Distiller支持的高级统计建模算法,包括聚类、分类和回归。 本文档详细介绍了使用可用算法的过程、算法参数以及如何使用SQL扩展生成特定于客户的模型以满足您的业务需求。
后续步骤
若要了解如何使用数据Distiller功能执行复杂的机器学习任务,请阅读功能工程文档。 它概述了如何将您的数据转换为准备好进行建模的功能。 接下来,继续阅读模型文档,该文档将指导您使用设计功能创建、培训和管理可信模型。 最后,浏览实施高级统计模型文档,了解各种可用的可信模型以及如何在SQL工作流中实施它们。
recommendation-more-help
ccf2b369-4031-483f-af63-a93b5ae5e3fb