在数据科学工作区UI中培训和评估模型

在Adobe Experience Platform数据科学工作区中,机器学习模型是通过整合符合模型意图的现有Recipe来创建的。 然后,对模型进行训练和评估,通过微调其相关的超参数来优化其运行效率和功效。 菜谱是可重用的,这意味着可以使用单个菜谱创建多个模型并针对特定用途进行定制。

本教程将逐步介绍创建、培训和评估模型的步骤。

入门指南

要完成本教程,您必须具有对Experience Platform的访问权限。 如果您无权访问Experience Platform中的IMS组织,请在继续操作前与系统管理员联系。

本教程需要现有的“菜谱”。 如果您没有菜谱,请按照UI](./import-packaged-recipe-ui.md)教程中的[导入打包菜谱,然后继续。

创建模型

  1. 在Adobe Experience Platform,单击左侧导航列中的​Models​链接以列表所有现有型号。 单击页面右上方的​创建模型​以开始模型创建过程。

  2. 浏览现有菜谱的列表,找到并选择要用于创建模型的菜谱,然后单击​下一步

  3. 选择适当的输入数据集,然后单击​Next。 这将设置“模型”的默认输入培训数据集。

  4. 为“模型”提供名称并查看默认的“模型”配置。 在“处方”创建过程中应用了默认配置,通过多次单击这些值来检查和修改配置值。 要提供新的配置集,请单击​上传新配置,并将包含模型配置的JSON文件拖至浏览器窗口。 单击​完成​以创建模型。

    注意

    配置是唯一的,且特定于其预期的处方,这意味着零售销售处方的配置将不适用于产品Recommendations处方。 有关零售销售处方配置的列表,请参阅reference部分。

创建培训运行

  1. 在Adobe Experience Platform,单击左侧导航列中的​Models​链接以列表所有现有型号。 查找并单击要培训的模型的名称。

  2. 将列出所有具有当前培训状态的现有培训运行。 对于使用Data Science Workspace用户界面创建的模型,将自动生成并使用默认配置和输入培训数据集执行培训运行。

  3. 单击“模型概述”页右上角的​Train,创建新的培训运行。

  4. 为培训运行选择培训输入数据集,然后单击​下一步

  5. 在“模型”(Model)创建过程中提供的默认配置将显示出来,通过多次单击这些值,相应地更改和修改这些配置。 单击​完成​以创建并执行培训运行。

    注意

    配置是唯一的,且特定于其预期的处方,这意味着零售销售处方的配置将不适用于产品Recommendations处方。 有关零售销售处方配置的列表,请参阅reference部分。

评估模型

  1. 在Adobe Experience Platform,单击左侧导航列中的​Models​链接以列表所有现有型号。 查找并单击要评估的模型的名称。

  2. 将列出所有具有当前培训状态的现有培训运行。 对于多个已完成的培训运行,可以在模型评估图表中比较不同培训运行的评估指标,使用图表上方的下拉列表选择评估指标。

    平均绝对百分比误差(MAPE)度量以误差百分比表示精度。 这用于识别效果最佳的实验。 MAPE越低越好。

    “精确度”度量描述相关实例与已检索​*实例总数的百分比。*精确度可以看作是随机选择的结果正确的概率。

    单击特定培训运行以视图该运行的详细信息。 甚至可以在运行完成之前完成此操作。 在“运行详细信息”页上,您可以看到特定于培训运行的其他评估指标、配置参数和可视化。 您还可以下载活动日志以查看运行的详细信息。 日志对于失败的运行来查看出错的内容尤为有用。

  3. 无法训练超参数,必须通过测试不同的超参数组合来优化模型。 重复此模型培训和评估过程,直到您到达一个优化的模型。

后续步骤

本教程指导您在Data Science Workspace中创建、培训和评估模型。 到达优化模型后,您可以使用经过培训的模型根据UI](./score-model-ui.md)教程中的[对模型评分来生成洞察。

参考

零售销售处方配置

超参数决定模型的训练行为,修改超参数将影响模型的准确性和精度:

超参数 描述 推荐范围
learning_rate 学习率通过learning_rate缩减了每棵树的贡献。 学习率和n估计量之间存在权衡。 0.1
n_mediators 要执行的提升阶段数。 渐变提升对过拟合相当稳健,因此,大数量通常会产生更好的性能。 100
max_depth 单个回归估计器的最大深度。 最大深度限制树中的节点数。 调整此参数以获得最佳性能;最佳值取决于输入变量的交互。 3

其他参数确定模型的技术属性:

参数键 类型 描述
ACP_DSW_INPUT_FEATURES 字符串 列表以逗号分隔的输入模式属性。
ACP_DSW_TARGET_FEATURES 字符串 列表以逗号分隔的输出模式属性。
ACP_DSW_FEATURE_UPDATE_SUPPORT 布尔值 确定输入和输出功能是否可修改
tenantId 字符串 此ID可确保您创建的资源命名正确且包含在IMS组织中。 请按照以下 步骤查找您的租户ID。
ACP_DSW_TRAINING_XDM_SCHEMA 字符串 用于培训模型的输入模式。
evaluation.labelColumn 字符串 用于评估可视化的列标签。
evaluation.metrics 字符串 用于评估模型的评估指标的逗号分隔列表。
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA 字符串 用于对模型进行评分的输出模式。

在此页面上

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free