文档 Experience Platform 数据科学 Workspace 指南

创建和发布机器学习模型

Last update: Tue Aug 06 2024 00:00:00 GMT+0000 (Coordinated Universal Time)

主题：
Data Science Workspace

创建对象：

用户
开发人员

NOTE

数据科学Workspace不再可供购买。

本文档面向之前有权访问数据科学Workspace的现有客户。

以下指南介绍了创建和发布机器学习模型所需的步骤。每个部分都包含将要执行操作的描述，以及一个指向UI和API文档的链接，以便执行所述的步骤。

快速入门

在开始本教程之前，您必须满足以下先决条件：

访问Adobe Experience Platform。如果您在Experience Platform中无权访问某个组织，请在继续操作之前与系统管理员联系。
所有数据科学工作区教程均使用亮度倾向模型。若要跟进，您必须已创建亮度性征模型架构和数据集。

浏览数据并了解架构

登录到Adobe Experience Platform并选择 数据集 以列出所有现有数据集，并选择要浏览的数据集。在这种情况下，您应选择 亮度Web数据 数据集。

选择Luma Web数据集

此时将打开数据集活动页面，其中列出与数据集相关的信息。您可以选择右上角附近的 预览数据集 来检查示例记录。您还可以查看选定数据集的架构。

预览Luma Web数据

在右边栏中选择架构链接。此时会出现一个弹出窗口，选择 架构名称 下的链接将在新选项卡中打开架构。

预览luma web数据架构

您可以使用提供的探索数据分析(EDA)笔记本进一步浏览数据。此笔记本可用于帮助了解Luma数据中的模式、检查数据健康度并总结预测倾向模型的相关数据。若要了解有关探索性数据分析的更多信息，请访问EDA文档。

创建Luma倾向方法 author-your-model

Data Science Workspace生命周期的主要组件涉及创作配方和模型。 Luma倾向模型旨在预测客户是否有从Luma购买产品的高倾向。

要创建Luma倾向模型，请使用方法生成器模板。配方是模型的基础，因为它们包含用于解决特定问题的机器学习算法和逻辑。更重要的是，“方法”使您能够让整个组织的机器学习普及化，使其他用户无需编写任何代码即可访问用于不同用例的模型。

按照使用JupyterLab Notebooks教程创建模型，以创建在后续教程中使用的Luma倾向模型方法。

从外部源导入并打包配方（可选）

如果您希望导入并打包方法以用于Data Science Workspace，则必须将源文件打包到存档文件中。将源文件打包到方法教程中。本教程向您展示如何将源文件打包到处方中，这是将处方导入到Data Science Workspace的先决步骤。教程完成后，您将获得一个Docker图像以及相应的图像URL（即，存档文件），并将在Azure容器注册表中提供。

此存档文件可用于在Data Science Workspace中创建处方，方法是使用UI工作流或API工作流遵循处方导入工作流。

训练和评估模型 train-and-evaluate-your-model

现在，您的数据已经准备好，配方也已准备就绪，您可以进一步创建、训练和评估您的机器学习模型。在使用“处方生成器”时，您应在将模型包装成处方之前，先对其进行培训、评分和评估。

数据科学工作区UI和API允许您将处方作为模型发布。此外，还可进一步微调模型的特定方面，如添加、删除和更改超参数。

创建模型

要了解有关使用UI创建模型的更多信息，请访问培训并在数据科学Workspace UI教程或API教程中评估模型。本教程提供了一个示例，说明如何创建、训练和更新超参数以微调模型。

NOTE

无法学习超参数，因此必须在运行训练之前分配超参数。调整超参数可能会改变训练模型的精度。由于优化模型是一个迭代过程，因此在获得满意的评估之前，可能需要多次训练运行。

为模型评分 score-a-model

创建和发布模型的下一步是使模型可操作化，以便从数据湖和实时客户个人资料获得见解并使用该见解。

通过将输入数据馈送到现有的已训练模型，可以在数据科学Workspace中进行评分。评分结果将作为新批次存储在指定的输出数据集中并可供查看。

要了解如何对模型评分，请访问模型UI教程或API教程的评分。

Publish将模型计为服务

数据科学Workspace允许您将经过训练的模型发布为服务。这使您组织内的用户无需创建自己的模型即可对数据进行评分。

要了解如何将模型发布为服务，请访问UI教程或API教程。

安排服务的自动培训

将模型发布为服务后，您可以为机器学习服务设置计划的评分和培训运行。通过自动执行培训和评分流程，您可以随时跟踪数据中的模式，从而保持和提高服务的效率。访问在Data Science Workspace UI中安排模型教程。

NOTE

您只能从UI计划用于自动训练和评分的模型。

后续步骤 next-steps

Adobe Experience Platform Data Science Workspace提供了用于创建、评估和利用机器学习模型生成数据预测和洞察的工具和资源。将机器学习分析摄取到启用了Profile的数据集时，还会将该相同数据作为Profile记录摄取，然后可以使用Adobe Experience Platform Segmentation Service对其进行分段。

摄取用户档案和时间序列数据时，实时客户档案会通过称为流式客户细分的持续过程自动决定从区段包含或排除该数据，然后再将其与现有数据合并并更新合并视图。因此，您可以即刻执行计算并做出决策，以便在客户与您的品牌互动时向客户交付增强的个性化体验。

访问教程使用机器学习分析丰富实时客户个人资料，了解有关如何利用机器学习分析的更多信息。

recommendation-more-help

cc79fe26-64da-411e-a6b9-5b650f53e4e9