在数据科学工作区 UI 中导入打包配方
本教程提供了有关如何使用提供的零售销售示例配置和导入打包配方的见解。 在本教程结束时,您将能够在 Adobe Experience Platform Data Science Workspace中创建、训练和评估模型。
先决条件
本教程需要 Docker 镜像 URL 形式的打包配方。 有关更多信息,请参阅有关如何将源文件打包到配方🔗中的教程。
UI 工作流程
将 Data Science Workspace 打包的配方导入需要特定的配方配置,编译成单个 JavaScript 对象表示法 (JSON) 文件,此配方配置编译称为配置文件。 具有一组特定配置的打包配方称为配方实例。 一个配方可用于在 中创建 Data Science Workspace多个配方实例。
导入包装配方的工作流程包括以下步骤:
配置配方 configure
中的每个 Data Science Workspace 配方实例都附带一组配置,这些配置可定制配方实例以适应特定用例。 配置文件定义使用此方法实例创建的模型的默认训练和评分行为。
下面是一个示例配置文件,其中显示零售方法的默认培训和评分行为。
[
{
"name": "train",
"parameters": [
{
"key": "learning_rate",
"value": "0.1"
},
{
"key": "n_estimators",
"value": "100"
},
{
"key": "max_depth",
"value": "3"
},
{
"key": "ACP_DSW_INPUT_FEATURES",
"value": "date,store,storeType,storeSize,temperature,regionalFuelPrice,markdown,cpi,unemployment,isHoliday"
},
{
"key": "ACP_DSW_TARGET_FEATURES",
"value": "weeklySales"
},
{
"key": "ACP_DSW_FEATURE_UPDATE_SUPPORT",
"value": false
},
{
"key": "tenantId",
"value": "_{TENANT_ID}"
},
{
"key": "ACP_DSW_TRAINING_XDM_SCHEMA",
"value": "{SEE BELOW FOR DETAILS}"
},
{
"key": "evaluation.labelColumn",
"value": "weeklySalesAhead"
},
{
"key": "evaluation.metrics",
"value": "MAPE,MAE,RMSE,MASE"
}
]
},
{
"name": "score",
"parameters": [
{
"key": "tenantId",
"value": "_{TENANT_ID}"
},
{
"key":"ACP_DSW_SCORING_RESULTS_XDM_SCHEMA",
"value":"{SEE BELOW FOR DETAILS}"
}
]
}
]
learning_rate
n_estimators
max_depth
ACP_DSW_INPUT_FEATURES
ACP_DSW_TARGET_FEATURES
ACP_DSW_FEATURE_UPDATE_SUPPORT
ACP_DSW_TRAINING_XDM_SCHEMA
evaluation.labelColumn
evaluation.metrics
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA
在本教程中,您可以在Data Science Workspace引用中保留零售方法的默认配置文件,方法如下所示。
导入基于Docker的方法 — Python python
首先导航并选择位于Platform UI左上角的 工作流。 接下来,选择 导入方法 并选择 启动。
此时 将显示导入配方 工作流程的 配置 页面。输入配方的名称和描述,然后选择 右上角的下一步。
进入 选择源 页面后,将与使用 Python 源文件构建的打包配方相对应的 Docker URL 粘贴到 源 URL 字段中。 接下来,通过拖放导入提供的配置文件,或使用文件系统 浏览器。 有关提供的配置文件,请参阅 experience-platform-dsw-reference/recipes/python/retail/retail.config.json
。 在 运行时 下拉列表中选择 Python,在 类型 下拉列表中选择 分类。 填写完所有内容后,选择右上角的“下一步”以继续“ 管理架构 ”。
接下来,在“管理架构”部分 下选择“零售销售”输入和输出架构,它们是使用创建零售销售架构和数据集🔗教程中提供的引导脚本 创建的。
在“ 功能管理 ”部分下,在架构查看器中选择租户标识以展开“零售销售”输入架构。 通过突出显示所需要素并在右侧字段属性 窗口中选择 输入要素或 目标要素 来选择输入和 输出要素。 在本教程中,将“每周销售额”设置为 “目标要素”,将其他所有内容设置为****“输入要素 ”。 选择下一步 以查看新配置的配方。
查看配方,根据需要添加、修改或删除配置。 选择“完成 ” 以创建配方。
继续执行 后续步骤 ,了解如何使用新创建的零售销售配方创建模型 Data Science Workspace 。
导入基于 Docker 的配方 - R r
首先导航并选择 位于 UI 左Platform上角的工作流。接下来,选择导入 配方 ,然后选择 启动。
此时 将显示导入配方 工作流程的 配置 页面。输入配方的名称和描述,然后选择 右上角的下一步。
进入 “选择源”页后,将对应于使用 R 源文件生成的打包配方的 Docker URL 粘贴到“源 URL ” 字段中。接下来,通过拖放导入提供的配置文件,或使用文件系统 浏览器。 有关提供的配置文件,请参阅 experience-platform-dsw-reference/recipes/R/Retail\ -\ GradientBoosting/retail.config.json
。 在“运行时 ”下拉列表中选择“R”,在 “类型”下拉列表中选择 “分类 ”。 填写完所有内容后,选择右上角的“下一步”以继续“ 管理架构 ”。
接下来,在“管理架构”部分 下选择“零售销售”输入和输出架构,它们是使用创建零售销售架构和数据集🔗教程中提供的引导脚本 创建的。
在“ 功能管理 ”部分下,在架构查看器中选择租户标识以展开“零售销售”输入架构。 通过突出显示所需要素并在右侧字段属性 窗口中选择 输入要素或 目标要素 来选择输入和 输出要素。 在本教程中,将“每周销售额”设置为 “目标要素”,将其他所有内容设置为****“输入要素 ”。 选择“下一步 ” 以查看新配置的配方。
查看方法,根据需要添加、修改或删除配置。 选择 完成 以创建方法。
继续执行后续步骤,了解如何使用新创建的零售方法在Data Science Workspace中创建模型。
导入基于 Docker 的配方 - PySpark pyspark
首先导航并选择 位于 UI 左Platform上角的工作流。接下来,选择导入 配方 ,然后选择 启动。
此时将显示 导入方法 工作流的 配置 页面。 输入方法的名称和描述,然后选择右上角的 下一步 以继续。
进入 选择源 页面后,将对应于使用PySpark源文件构建的打包方法的Docker URL粘贴到 Source URL 字段中。 接下来,通过拖放方式导入提供的配置文件,或者使用文件系统 浏览器。 提供的配置文件可在experience-platform-dsw-reference/recipes/pyspark/retail/pipeline.json
找到。 在 运行时 下拉列表中选择 PySpark。 选择PySpark运行时后,默认工件会自动填充到 Docker。 接下来,在 类型 下拉列表中选择 分类。 填写完所有内容后,选择右上角的 下一步 以继续执行 管理架构。
接下来,使用“管理架构 ”选择器选择 零售销售输入和输出架构,这些架构是使用创建零售销售架构和数据集🔗教程中提供的引导脚本创建的。
在“ 功能管理 ”部分下,在架构查看器中选择租户标识以展开“零售销售”输入架构。 通过突出显示所需要素并在右侧字段属性 窗口中选择 输入要素或 目标要素 来选择输入和 输出要素。 在本教程中,请将 weeklySales 设置为 目标功能,其他内容设置为 输入功能。 选择 下一步 以查看您新配置的方法。
查看方法,根据需要添加、修改或删除配置。 选择“完成 ” 以创建配方。
继续执行 后续步骤 ,了解如何使用新创建的零售销售配方创建模型 Data Science Workspace 。
导入基于 Docker 的配方 - Scala scala
首先导航并选择位于Platform UI左上角的 工作流。 接下来,选择 导入方法 并选择 启动。
此时将显示 导入方法 工作流的 配置 页面。 输入方法的名称和描述,然后选择右上角的 下一步 以继续。
进入 选择源 页面后,将对应于使用Scala源文件构建的打包方法的Docker URL粘贴到Source URL字段中。 接下来,通过拖放方式导入提供的配置文件,或者使用文件系统浏览器。 提供的配置文件可在experience-platform-dsw-reference/recipes/scala/retail/pipelineservice.json
找到。 在 运行时 下拉列表中选择 Spark。 选择Spark运行时后,默认工件会自动填充到 Docker。 接下来,从 类型 下拉列表中选择 回归。 填写完所有内容后,选择右上角的 下一步 以继续执行 管理架构。
接下来,使用“管理架构 ”选择器选择 零售销售输入和输出架构,这些架构是使用创建零售销售架构和数据集🔗教程中提供的引导脚本创建的。
在“ 功能管理 ”部分下,在架构查看器中选择租户标识以展开“零售销售”输入架构。 通过突出显示所需要素并在右侧字段属性 窗口中选择 输入要素或 目标要素 来选择输入和 输出要素。 在本教程中,请将“weeklySales”设置为 “目标功能 ”,将其他所有内容设置为 “输入功能”。 选择下一步 以查看新配置的配方。
查看方法,根据需要添加、修改或删除配置。 选择 完成 以创建方法。
继续执行 后续步骤 ,了解如何使用新创建的零售销售配方创建模型 Data Science Workspace 。
后续步骤 next-steps
本教程提供了有关配置配方并将其导入 的 Data Science Workspace见解。 现在,您可以使用新创建的配方创建、训练和评估模型。