创建和发布机器学习模型

假装您拥有在线零售网站。 当您的客户在您的零售网站上购物时,您希望向他们展示个性化的产品推荐,以展示您的业务优惠的各种其他产品。 在您网站的整个存在过程中,您不断收集客户数据并希望以某种方式利用这些数据生成个性化的产品推荐。

Adobe Experience Platform Data Science Workspace 借助预建的产品Recommendations菜谱,提供实现 您目标的方法。请阅读本教程,了解如何访问和了解您的零售数据、创建和优化机器学习模型以及在Data Science Workspace中生成洞察。

本教程介绍了Data Science Workspace的工作流程,并介绍了创建机器学习模型的以下步骤:

  1. 准备数据
  2. 创作模型
  3. 培训和评估您的模型
  4. 操作模型

入门指南

在开始本教程之前,您必须具备以下先决条件:

  • 访问Adobe Experience Platform。 如果您无权访问Experience Platform中的IMS组织,请在继续操作之前与您的系统管理员联系。

  • Enablement Assets。 请联系您的客户代表,为您提供以下项目。

    • Recommendations菜谱
    • Recommendations输入数据集
    • Recommendations输入模式
    • Recommendations输出数据集
    • Recommendations输出模式
    • Golden Data Set postValues
    • 黄金数据集模式
  • Adobe public Git repository下载三个必需的Jupyter Notebook文件,这些文件将用于演示Data Science Workspace中的JupyterLab工作流。

了解本教程中使用的以下主要概念:

  • Experience Data Model:由Adobe领导的标准化工作,为客户体验管理定 Profile 义标准模式,如和ExperienceEvent。
  • 数据集:实际数据的存储和管理结构。 XDM模式的物理实例化实例。
  • 批:数据集由批量组成。 批是在一段时间内收集的一组数据,并作为单个单元一起处理。
  • JupyterLab: JupyterLab 是一个面向Project的开放源代码、基于web的 Jupyter 界面,并紧密集成到 Experience Platform中

准备数据

要创建能够向客户推荐个性化产品的机器学习模型,必须分析您网站上先前的客户购买。 本节探讨如何通过Adobe Analytics将此数据引入Platform,以及如何将该数据转换为要由机器学习模型使用的特征数据集。

浏览数据并了解模式

登录到Adobe Experience Platform并选择​Datasets​以列表所有现有数据集并选择要浏览的数据集。 在这种情况下,Analytics数据集​Golden Data Set postValues

此时将打开数据集活动页,其中列出与您的数据集相关的信息。 您可以选择右上角附近的​Preview Dataset​来检查示例记录。 您还可以视图所选数据集的模式。 在右边栏中选择模式链接。 出现一个快显窗口,选择​schema name​下的链接将在新选项卡中打开模式。

其他数据集已预填充了批,以用于预览。 您可以重复上述步骤来视图这些数据集。

数据集名称 架构 描述
Golden Data Set postValues 黄金数据集模式 Analytics 您网站中的源数据
Recommendations输入数据集 Recommendations输入模式 使用功能管道将Analytics数据转换为培训数据集。 此数据用于培训产品Recommendations机器学习模型。 itemid 与该 userid 客户购买的产品相对应。
Recommendations输出数据集 Recommendations输出模式 存储了评分结果的数据集,其中将包含每个客户推荐产品的列表。

创作模型

Data Science Workspace生命周期的第二个组件涉及创作方法和模型。 产品Recommendations菜谱旨在通过利用过去的购买数据和机器学习大规模生成产品推荐。

菜谱是模型的基础,因为它们包含机器学习算法和用于解决特定问题的逻辑。 更重要的是,秘诀使您能够在整个组织内实现机器学习的大众化,使其他用户无需编写任何代码即可访问针对不同使用案例的模型。

浏览产品Recommendations菜谱

在Experience Platform中,从左侧导航列导航到​Models,然后在顶部导航中选择​Recipes​以视图组织的可用方法列表。

接下来,选择提供的​Recommendations Recipe​名称,找到并打开它。 此时将显示“菜谱”概述页。

然后,在右边栏中,选择​Recommendations Input Schema​以视图为菜谱提供动力的模式。 模式字段“itemId”和“userId”对应于该客户在特定时间(timestamp)购买的产品(interactionType)。 按照相同的步骤查看​Recommendations Output Schema​的字段。

您现在已查看了产品Recommendations方法所需的输入和输出模式。 请继续阅读下一节,了解如何创建、培训和评估产品Recommendations模型。

培训和评估您的型号

现在您的数据已准备就绪,菜谱已准备就绪,您可以创建、培训和评估您的机器学习模型。

创建模型

“模型”是“处方”的实例,使您能够大规模地对数据进行培训和评分。

在Experience Platform中,从左侧导航列导航到​Models,然后在顶部导航中选择​Recipes。 它显示组织的可用菜谱的列表。选择产品推荐菜谱。

在菜谱页面中,选择​Create Model

创建模型

通过选择菜谱开始创建模型工作流。 选择​Recommendations Recipe,然后选择右上角的​Next

然后,提供模型名称。 列出了模型的可用配置,其中包含模型默认培训和评分行为的设置。 查看配置并选择​Finish

您将通过新生成的培训运行重定向模型概述页面。 默认情况下,创建模型时会生成培训运行。

您可以选择等待培训运行完成,或在下一节中继续创建新的培训运行。

使用自定超参数训练模型

在​模型概述​页面上,选择右上角附近的​Train​以创建新的培训运行。 选择创建模型时使用的相同输入数据集,然后选择​Next

将显示​Configuration​页。 您可以在此配置培训运行num_recommendations值,也称为超参数。 训练和优化模型将根据训练结果利用性能最佳的超参数。

无法学习超参数,因此必须在进行培训运行之前分配超参数。 调整超参数可能会改变训练模型的精度。 由于优化模型是一个迭代过程,因此在获得满意的评价之前可能需要多次训练运行。

小贴士

num_recommendations设置为10。

模型评估图表上会显示其他数据点。 运行完成后,此图标最多可能需要几分钟才能显示。

评估模型

每次培训运行完成时,您都可以视图生成的评估量度,以确定模型的执行情况。

要查看每个已完成培训运行的评估量度(“精确度”和“召回率”),请选择培训运行。

您可以浏览为每个评估量度提供的信息。 这些指标越高,模型的表现就越好。

您可以在右侧边栏上查看用于每个培训运行的数据集、模式和配置参数。 导航回“模型”页,通过观察其评估量度来确定运行效果最佳的培训。

操作模型

数据科学工作流程的最后一步是操作模型,以便从数据存储中得分和使用洞察。

评分和生成洞察

在“产品推荐模型概述”页面上,选择性能最佳的培训运行的名称,其召回率和准确度值最高。

打得最好

然后,在培训运行详细信息页面的右上角,选择​Score

选择分数

接下来,选择​Recommendations Input Dataset​作为评分输入数据集,该数据集与您创建“模型”并执行其培训运行时使用的数据集相同。 然后,选择​Next

获得输入数据集后,选择​Recommendations Output Dataset​作为评分输出数据集。 评分结果作为批存储在此数据集中。

最后,查看评分配置。 这些参数包含您之前选择的输入和输出数据集以及相应的模式。 选择​Finish​开始计分运行。 运行可能需要几分钟才能完成。

视图的洞察

评分运行成功完成后,您可以预览结果并视图生成的洞察。

在评分运行页面上,选择已完成的评分运行,然后在右边栏上选择​Preview Scoring Results Dataset

在预览表中,每行包含针对特定客户的产品推荐,分别标记为recommendations和userId。 由于示例屏幕截图中的num_recommendations超参数设置为10,因此每行推荐最多可包含10个产品标识,用数字符号(#)分隔。

后续步骤

本教程向您介绍了Data Science Workspace的工作流程,演示如何通过机器学习将未处理的原始数据转换为有用的信息。 要了解有关使用Data Science Workspace的详细信息,请继续阅读有关创建零售销售模式和数据集🔗的下一个指南。

在此页面上