创建和发布机器学习模型

以下指南介绍了创建和发布机器学习模型所需的步骤。 每个部分都包含将要执行操作的描述,以及一个指向UI和API文档的链接,以便执行所述的步骤。

快速入门

在开始本教程之前,您必须满足以下先决条件:

  • 访问Adobe Experience Platform。 如果您无权访问Experience Platform中的组织,请在继续之前与系统管理员交谈。

  • 所有数据科学Workspace教程都使用Luma倾向模型。 为了遵循,您必须已创建Luma倾向模型架构和数据集

浏览数据并了解架构

登录到Adobe Experience Platform,然后选择​ 数据集 ​以列出所有现有数据集,并选择要浏览的数据集。 在这种情况下,您应该选择​ Luma Web数据 ​数据集。

选择Luma Web数据集

此时将打开数据集活动页面,其中列出与数据集相关的信息。 您可以选择右上角附近的​ 预览数据集 ​来检查示例记录。 您还可以查看选定数据集的架构。

预览Luma Web数据

在右边栏中选择架构链接。 此时会出现一个弹出窗口,选择​ 架构名称 ​下的链接将在新选项卡中打开架构。

预览luma web数据架构

您可以使用提供的探索数据分析(EDA)笔记本进一步浏览数据。 此笔记本可用于帮助了解Luma数据中的模式、检查数据健康度并总结预测倾向模型的相关数据。 若要了解有关探索性数据分析的更多信息,请访问EDA文档

创建Luma倾向方法 author-your-model

Data Science Workspace生命周期的主要组件涉及创作配方和模型。 Luma倾向模型旨在预测客户是否有从Luma购买产品的高倾向。

要创建Luma倾向模型,请使用方法生成器模板。 配方是模型的基础,因为它们包含用于解决特定问题的机器学习算法和逻辑。 更重要的是,“方法”使您能够让整个组织的机器学习普及化,使其他用户无需编写任何代码即可访问用于不同用例的模型。

按照使用JupyterLab Notebooks教程创建模型,以创建在后续教程中使用的Luma倾向模型方法。

从外部源导入并打包配方(可选

如果您希望导入并打包方法以用于Data Science Workspace,则必须将源文件打包到存档文件中。 将源文件打包到方法教程中。 本教程向您展示如何将源文件打包到方法中,这是将方法导入数据科学Workspace的先决步骤。 完成教程后,将在Azure容器注册表中为您提供Docker图像,以及相应的图像URL,即存档文件。

此存档文件可用于在数据科学Workspace中创建方法,方法是使用UI工作流API工作流遵循方法导入工作流。

训练和评估模型 train-and-evaluate-your-model

现在您的数据已准备好,方法已准备好,您能够进一步创建、培训和评估您的机器学习模型。 在使用方法生成器时,您应该在将模型打包到方法中之前对模型进行培训、评分和评估。

数据科学Workspace UI和API允许您将方法作为模型发布。 此外,还可进一步微调模型的特定方面,如添加、删除和更改超参数。

创建模型

要了解有关使用UI创建模型的更多信息,请访问培训并在数据科学Workspace UI教程API教程中评估模型。 本教程提供了一个示例,说明如何创建、训练和更新超参数以微调模型。

NOTE
无法学习超参数,因此必须在运行训练之前分配超参数。 调整超参数可能会改变训练模型的精度。 由于优化模型是一个迭代过程,因此在获得满意的评估之前,可能需要多次训练运行。

为模型评分 score-a-model

创建和发布模型的下一步是使模型可操作化,以便从数据湖和实时客户个人资料获得见解并使用该见解。

通过将输入数据馈送到现有的已训练模型,可以在数据科学Workspace中进行评分。 评分结果将作为新批次存储在指定的输出数据集中并可供查看。

要了解如何对模型评分,请访问模型UI教程API教程的评分。

Publish将模型计为服务

数据科学Workspace允许您将经过训练的模型发布为服务。 这使您组织内的用户无需创建自己的模型即可对数据进行评分。

要了解如何将模型发布为服务,请访问UI教程API教程

安排服务的自动培训

将模型发布为服务后,即可为机器学习服务设置计划的评分和训练运行。 自动化培训和评分过程有助于通过及时跟踪数据中的模式来维护和改善服务的效率。 访问数据科学Workspace UI🔗教程中的计划模型。

NOTE
您只能从UI计划用于自动训练和评分的模型。

后续步骤 next-steps

Adobe Experience Platform Data Science Workspace提供了用于创建、评估和利用机器学习模型生成数据预测和洞察的工具和资源。 将机器学习分析摄取到启用了Profile的数据集时,还会将该相同数据作为Profile记录摄取,然后可以使用Adobe Experience Platform Segmentation Service对其进行分段。

摄取用户档案和时间序列数据时,实时客户档案会通过称为流式客户细分的持续过程自动决定从区段包含或排除该数据,然后再将其与现有数据合并并更新合并视图。 因此,您可以即刻执行计算并做出决策,以便在客户与您的品牌互动时向客户交付增强的个性化体验。

访问教程使用机器学习分析丰富实时客户个人资料,了解有关如何利用机器学习分析的更多信息。

recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9