在数据科学工作区UI中导入打包的处方
本教程提供了有关如何使用提供的零售示例配置和导入打包方法的分析。 在本教程结束时,您将准备好在Adobe Experience Platform中创建、培训和评估模型 Data Science Workspace.
先决条件
本教程需要采用Docker图像URL形式的打包方法。 请参阅教程,了解如何 将源文件打包到方法中 了解更多信息。
UI工作流
将包装的配方导入 Data Science Workspace 需要特定的方法配置,编译为一个JavaScript对象表示法(JSON)文件,这种方法配置的编译称为配置文件。 具有特定配置集的包装配方称为配方实例。 一种方法可用于在中创建多个方法实例 Data Science Workspace.
用于导入程序包方法的工作流包含以下步骤:
配置方法 configure
中的每个方法实例 Data Science Workspace 随附一组配置,这些配置定制方法实例以适应特定用例。 配置文件定义使用此方法实例创建的模型的默认训练和评分行为。
下面是一个示例配置文件,它显示零售方法默认的培训和评分行为。
[
{
"name": "train",
"parameters": [
{
"key": "learning_rate",
"value": "0.1"
},
{
"key": "n_estimators",
"value": "100"
},
{
"key": "max_depth",
"value": "3"
},
{
"key": "ACP_DSW_INPUT_FEATURES",
"value": "date,store,storeType,storeSize,temperature,regionalFuelPrice,markdown,cpi,unemployment,isHoliday"
},
{
"key": "ACP_DSW_TARGET_FEATURES",
"value": "weeklySales"
},
{
"key": "ACP_DSW_FEATURE_UPDATE_SUPPORT",
"value": false
},
{
"key": "tenantId",
"value": "_{TENANT_ID}"
},
{
"key": "ACP_DSW_TRAINING_XDM_SCHEMA",
"value": "{SEE BELOW FOR DETAILS}"
},
{
"key": "evaluation.labelColumn",
"value": "weeklySalesAhead"
},
{
"key": "evaluation.metrics",
"value": "MAPE,MAE,RMSE,MASE"
}
]
},
{
"name": "score",
"parameters": [
{
"key": "tenantId",
"value": "_{TENANT_ID}"
},
{
"key":"ACP_DSW_SCORING_RESULTS_XDM_SCHEMA",
"value":"{SEE BELOW FOR DETAILS}"
}
]
}
]
learning_rate
n_estimators
max_depth
ACP_DSW_INPUT_FEATURES
ACP_DSW_TARGET_FEATURES
ACP_DSW_FEATURE_UPDATE_SUPPORT
ACP_DSW_TRAINING_XDM_SCHEMA
evaluation.labelColumn
evaluation.metrics
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA
在本教程中,您可以将零售方法的默认配置文件保留在 Data Science Workspace 参考它们的方式。
导入基于Docker的方法 — Python python
首先,导航并选择 工作流 位于左侧的 Platform UI。 接下来,选择 导入方法 并选择 Launch.
此 配置 页面 导入方法 此时会显示工作流。 输入处方的名称和说明,然后选择 下一个 在右上角。
一旦您使用 选择源 页面,粘贴与使用构建的已打包方法对应的Docker URL Python 中的源文件 源URL 字段。 接下来,通过拖放方式导入提供的配置文件,或者使用文件系统 浏览器. 提供的配置文件位于 experience-platform-dsw-reference/recipes/python/retail/retail.config.json
. 选择 Python 在 运行时 下拉菜单和 分类 在 类型 下拉菜单。 填写完所有内容后,选择 下一个 以继续执行 管理架构.
接下来,在部分下选择零售销售输入和输出架构 管理架构,它们是使用 创建零售架构和数据集 教程。
在 功能管理 部分,在架构查看器中选择租户标识以展开零售销售输入架构。 通过突出显示所需特征,然后选择任一特征来选择输入和输出特征 输入功能 或 目标功能 右侧 字段属性 窗口。 在本教程中,将 weeklySales 作为 目标功能 而其他所有东西都是 输入功能. 选择 下一个 查看您新配置的方法。
查看方法,根据需要添加、修改或删除配置。 选择 完成 创建方法。
继续执行 后续步骤 以了解如何在中创建模型 Data Science Workspace 使用新创建的零售方法。
导入基于Docker的方法 — R r
首先,导航并选择 工作流 位于左侧的 Platform UI。 接下来,选择 导入方法 并选择 Launch.
此 配置 页面 导入方法 此时会显示工作流。 输入处方的名称和说明,然后选择 下一个 在右上角。
一旦您使用 选择源 页面,将对应于使用R源文件构建的打包方法的Docker URL粘贴到 源URL 字段。 接下来,通过拖放方式导入提供的配置文件,或者使用文件系统 浏览器. 提供的配置文件位于 experience-platform-dsw-reference/recipes/R/Retail\ -\ GradientBoosting/retail.config.json
. 选择 R 在 运行时 下拉菜单和 分类 在 类型 下拉菜单。 填写完所有内容后,选择 下一个 以继续执行 管理架构.
接下来,在部分下选择零售销售输入和输出架构 管理架构,它们是使用 创建零售架构和数据集 教程。
在 功能管理 部分,在架构查看器中选择租户标识以展开零售销售输入架构。 通过突出显示所需特征,然后选择任一特征来选择输入和输出特征 输入功能 或 目标功能 右侧 字段属性 窗口。 在本教程中,将 weeklySales 作为 目标功能 而其他所有东西都是 输入功能. 选择 下一个 查看您的新配置方法。
查看方法,根据需要添加、修改或删除配置。 选择 完成 创建方法。
继续执行 后续步骤 以了解如何在中创建模型 Data Science Workspace 使用新创建的零售方法。
导入基于Docker的方法 — PySpark pyspark
首先,导航并选择 工作流 位于左侧的 Platform UI。 接下来,选择 导入方法 并选择 Launch.
此 配置 页面 导入方法 此时会显示工作流。 输入处方的名称和说明,然后选择 下一个 以继续。
一旦您使用 选择源 页面,将对应于使用PySpark源文件构建的打包方法的Docker URL粘贴到 源URL 字段。 接下来,通过拖放方式导入提供的配置文件,或者使用文件系统 浏览器. 提供的配置文件位于 experience-platform-dsw-reference/recipes/pyspark/retail/pipeline.json
. 选择 PySpark 在 运行时 下拉菜单。 选择PySpark运行时后,默认工件会自动填充到 Docker. 接下来,选择 分类 在 类型 下拉菜单。 填写完所有内容后,选择 下一个 以继续执行 管理架构.
接下来,使用以下方式选择零售销售输入和输出架构: 管理架构 选择器中,架构是使用中提供的引导脚本创建的 创建零售架构和数据集 教程。
在 功能管理 部分,在架构查看器中选择租户标识以展开零售销售输入架构。 通过突出显示所需特征,然后选择任一特征来选择输入和输出特征 输入功能 或 目标功能 右侧 字段属性 窗口。 在本教程中,将 weeklySales 作为 目标功能 而其他所有东西都是 输入功能. 选择 下一个 查看您新配置的方法。
查看方法,根据需要添加、修改或删除配置。 选择 完成 创建方法。
继续执行 后续步骤 以了解如何在中创建模型 Data Science Workspace 使用新创建的零售方法。
基于Docker的导入方法 — Scala scala
首先,导航并选择 工作流 位于左侧的 Platform UI。 接下来,选择 导入方法 并选择 Launch.
此 配置 页面 导入方法 此时会显示工作流。 输入处方的名称和说明,然后选择 下一个 以继续。
一旦您使用 选择源 页面,将对应于使用Scala源文件构建的打包方法的Docker URL粘贴到源URL字段中。 接下来,通过拖放方式导入提供的配置文件,或者使用文件系统浏览器。 提供的配置文件位于 experience-platform-dsw-reference/recipes/scala/retail/pipelineservice.json
. 选择 Spark 在 运行时 下拉菜单。 一旦 Spark 运行时处于选中状态,默认工件自动填充到 Docker. 接下来,选择 回归 从 类型 下拉菜单。 填写完所有内容后,选择 下一个 以继续执行 管理架构.
接下来,使用以下方式选择零售销售输入和输出架构: 管理架构 选择器中,架构是使用中提供的引导脚本创建的 创建零售架构和数据集 教程。
在 功能管理 部分,在架构查看器中选择租户标识以展开零售销售输入架构。 通过突出显示所需特征,然后选择任一特征来选择输入和输出特征 输入功能 或 目标功能 右侧 字段属性 窗口。 在本教程中,请设置"weeklySales”作为 目标功能 而其他所有东西都是 输入功能. 选择 下一个 查看您新配置的方法。
查看方法,根据需要添加、修改或删除配置。 选择 完成 创建方法。
继续执行 后续步骤 以了解如何在中创建模型 Data Science Workspace 使用新创建的零售方法。
后续步骤 next-steps
本教程提供了有关配置方法并将其导入到的见解 Data Science Workspace. 您现在可以使用新创建的方法创建、训练和评估模型。