在数据科学Workspace UI中培训和评估模型

在Adobe Experience Platform数据科学Workspace中,机器学习模型通过合并适用于模型意图的现有方法而创建。 然后对该模型进行训练和评估,以通过微调其相关的超参数来优化其运行效率和功效。 配方可重复使用,这意味着只需一个配方,即可创建多个模型并根据特定目的对其进行定制。

本教程将逐步介绍创建、训练和评估模型的步骤。

快速入门

要完成本教程,您必须拥有Experience Platform的访问权限。 如果您无权访问Experience Platform中的组织,请在继续之前与系统管理员交谈。

本教程需要现有方法。 如果您没有方法,请按照在UI中导入打包的方法教程中的说明继续操作。

创建模型

在Experience Platform中,选择位于左侧导航栏中的​ 模型 ​选项卡,然后选择“浏览”选项卡以查看现有模型。 选择页面右上角附近的​ 创建模型 ​以开始模型创建过程。

浏览现有方法列表,查找并选择要用于创建模型的方法并选择​ 下一步

选择适当的输入数据集并选择​ 下一步。 这将为模型设置默认输入训练数据集。

提供模型的名称并查看默认模型配置。 在方法创建、查看和修改配置值期间应用了默认配置,方法是双击值。

要提供一组新配置,请选择​ 上载新配置,然后将包含模型配置的JSON文件拖到浏览器窗口中。 选择​ 完成 ​以创建模型。

NOTE
配置是唯一的,并且特定于其预期方法,这意味着零售方法配置不适用于产品Recommendations方法。 有关零售方法配置的列表,请参阅引用部分。

创建训练运行

在Experience Platform中,选择位于左侧导航栏中的​ 模型 ​选项卡,然后选择“浏览”选项卡以查看现有模型。 查找并选择附加到要训练的模型名称的超链接。

列出所有现有训练运行及其当前训练状态。 对于使用Data Science Workspace用户界面创建的模型,使用默认配置和输入训练数据集自动生成并执行训练运行。

通过选择模型概述页面右上角附近的​ 训练 ​来创建新的训练运行。

为训练运行选择训练输入数据集,然后选择​ 下一步

模型创建期间提供的默认配置将显示出来,通过双击值可相应地更改和修改这些配置。 选择​ 完成 ​以创建和执行训练运行。

NOTE
配置是唯一的,并且特定于其预期方法,这意味着零售方法配置不适用于产品Recommendations方法。 有关零售方法配置的列表,请参阅引用部分。

评估模型

在Experience Platform中,选择位于左侧导航栏中的​ 模型 ​选项卡,然后选择“浏览”选项卡以查看现有模型。 查找并选择附加到要评估的模型名称的超链接。

选择模型

列出所有现有训练运行及其当前训练状态。 对于多个已完成的训练运行,可以在模型评估图表中跨不同的训练运行比较评估指标。 使用图表上方的下拉列表选择评估量度。

平均绝对百分比误差(MAPE)度量以误差百分比表示精度。 这用于标识表现最佳的试验。 MAPE越低越好。

训练运行概述

“精度”量度描述了相关实例与检索的​ ​实例总数之间的百分比。 精度可以看作是随机选择结果正确的可能性。

正在运行多个运行

通过选择特定的训练运行,可通过打开评估页面来提供运行的详细信息。 甚至可以在运行完成之前完成此操作。 在评估页面上,您可以看到特定于训练运行的其他评估指标、配置参数和可视化图表。

预览日志

您还可以下载活动日志以查看运行的详细信息。 日志对于失败运行以查看错误情况特别有用。

活动日志

不能训练超参数,必须通过测试不同的超参数组合来优化模型。 重复此模型训练和评估过程,直到到达优化模型为止。

后续步骤

本教程将指导您在Data Science Workspace中创建、培训和评估模型。 到达优化模型后,可以使用经过训练的模型生成见解,方法是按照在UI中对模型评分教程进行操作。

参考 reference

零售方法配置

超参数决定了模型的训练行为,修改超参数将会影响模型的精度和精度:

超参数
描述
建议范围
learning_rate
学习率通过learning_rate减小每个树的贡献。 学习速率和n估算之间存在一种权衡。
0.1
n_estimators
要执行的提升阶段数。 梯度提升算法对于过拟合有很好的鲁棒性,因此大量梯度提升算法通常可以获得更好的性能。
100
max_depth
单个回归估计值的最大深度。 最大深度限制树中的节点数。 调整此参数以获得最佳性能;最佳值取决于输入变量的交互作用。
3

其它参数可确定模型的技术属性:

参数键
类型
描述
ACP_DSW_INPUT_FEATURES
字符串
逗号分隔的输入架构属性列表。
ACP_DSW_TARGET_FEATURES
字符串
逗号分隔的输出架构属性列表。
ACP_DSW_FEATURE_UPDATE_SUPPORT
布尔值
确定输入和输出特征是否可修改
tenantId
字符串
此ID可确保正确命名您创建的资源,并将其包含在您的组织中。 按照此处的步骤查找您的租户ID。
ACP_DSW_TRAINING_XDM_SCHEMA
字符串
用于训练模型的输入架构。
evaluation.labelColumn
字符串
评估可视化图表的列标签。
evaluation.metrics
字符串
用于评估模型的评估指标列表(以逗号分隔)。
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA
字符串
用于对模型评分的输出架构。
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9