假装您拥有在线零售网站。 当您的客户在您的零售网站上购物时,您希望向他们提供个性化的产品建议,以展示您的业务优惠的各种其他产品。 在您网站的存在期间,您不断收集客户数据,并希望以某种方式利用这些数据生成个性化的产品推荐。
Adobe Experience Platform Data Science Workspace 借助预建的产品Recommendations菜谱,提供实现您 目标的方法。请按照本教程,了解如何访问和了解您的零售数据、创建和优化机器学习模型以及在Data Science Workspace中生成洞察。
本教程介绍了Data Science Workspace的工作流,并介绍了创建机器学习模型的以下步骤:
在开始本教程之前,您必须具有以下先决条件:
访问Adobe Experience Platform。 如果您无权访问Experience Platform中的IMS组织,请在继续操作前与系统管理员联系。
Enablement Assets。 请联系您的客户代表,为您提供以下项目。
从Adobe公共 Git 存储库下载三个必需的Jupyter Notebook文件,这些文件将用于演示Data Science Workspace中的JupyterLab工作流。
对本教程中使用的下列主要概念的有效理解:
要创建能够向客户提供个性化产品建议的机器学习模型,必须分析您网站上先前的客户购买情况。 本节探讨如何通过Adobe Analytics将此数据引入Platform,以及如何将该数据转换为功能数据集以供机器学习模型使用。
其他数据集已预先填充了批,以便进行预览。 您可以重复上述步骤来视图这些数据集。
数据集名称 | 架构 | 描述 |
---|---|---|
黄金数据集postValues | 黄金数据集模式 | Analytics 您网站的源数据 |
Recommendations输入数据集 | Recommendations输入模式 | 使用特征管道将Analytics数据转换为培训数据集。 此数据用于培训产品Recommendations机器学习模型。 itemid 和与 userid 该客户购买的产品相对应。 |
Recommendations输出数据集 | Recommendations产出模式 | 存储了评分结果的数据集,它将包含每个客户推荐产品的列表。 |
Data Science Workspace生命周期的第二个组件涉及创作方法和模型。 产品Recommendations处方旨在通过利用过去的购买数据和机器学习大规模生成产品推荐。
菜谱是模型的基础,因为它们包含机器学习算法和用于解决特定问题的逻辑。 更重要的是,菜谱使您能够在整个组织内实现机器学习的大众化,使其他用户能够访问针对不同用例的模型,而无需编写任何代码。
您现在已查看了“产品Recommendations处方”要求的输入和输出模式。 您现在可以继续阅读下一节,了解如何创建、培训和评估产品Recommendations模型。
现在您的数据已准备就绪,菜谱已经可供使用,您可以创建、培训和评估您的机器学习模型。
模型是处方的一个实例,使您能够大规模地对数据进行培训和评分。
您可以选择等待培训运行完成,或在下一节中继续创建新的培训运行。
在模型概述页面上,单击右上角附近的培训以创建新的培训运行。 选择创建模型时使用的同一输入数据集,然后单击Next。
将显示配置页。 您可以在此配置培训运行的“num_recommendations”值,也称为超级参数。 经过训练和优化的模型将根据训练结果使用性能最佳的超参数。
无法学习超参数,因此必须在进行培训之前分配超参数。 调整超参数可能会改变训练模型的精度。 由于优化模型是一个迭代过程,因此在获得满意的评估之前可能需要多次培训运行。
将num_recommendations设置为10。
新培训运行完成后,模型评估图表上将显示一个额外的数据点,这可能需要几分钟时间。
每次培训运行完成时,您都可以视图生成的评估指标,以确定模型的执行情况。
数据科学工作流程的最后一步是操作模型,以便从数据存储中得分和使用洞察。
评分运行成功完成后,您将能够预览结果并视图生成的洞察。
做得好,您已成功生成产品推荐!
本教程向您介绍了Data Science Workspace的工作流程,演示如何通过机器学习将未经处理的原始数据转换为有用的信息。 要进一步了解如何使用Data Science Workspace,请继续阅读有关创建零售销售模式和数据集](./create-retails-sales-dataset.md)的下一个指南。[