在Data Science Workspace UI中导入打包的方法

本教程提供了有关如何使用提供的零售销售示例配置和导入打包方法的分析。 在本教程结束时,您将准备好在Adobe Experience Platform中创建、培训和评估模型 Data Science Workspace.

先决条件

本教程需要以Docker图像URL形式打包的方法。 请参阅有关如何 将源文件打包到方法中 以了解更多信息。

UI工作流程

将打包的方法导入 Data Science Workspace 需要特定的方法配置(编译为单个JavaScript对象表示法(JSON)文件),此方法配置的编译称为配置文件。 具有一组特定配置的打包方法称为方法实例。 一个方法可用于在 Data Science Workspace.

导入资源包方法的工作流包含以下步骤:

配置方法

中的每个方法实例 Data Science Workspace 随附一组配置,这些配置定制了方法实例以适合特定用例。 配置文件定义使用此方法实例创建的模型的默认培训和评分行为。

注意

配置文件是特定于方法和案例的。

下面是一个示例配置文件,其中显示了零售销售方法的默认培训和评分行为。

[
    {
        "name": "train",
        "parameters": [
            {
                "key": "learning_rate",
                "value": "0.1"
            },
            {
                "key": "n_estimators",
                "value": "100"
            },
            {
                "key": "max_depth",
                "value": "3"
            },
            {
                "key": "ACP_DSW_INPUT_FEATURES",
                "value": "date,store,storeType,storeSize,temperature,regionalFuelPrice,markdown,cpi,unemployment,isHoliday"
            },
            {
                "key": "ACP_DSW_TARGET_FEATURES",
                "value": "weeklySales"
            },
            {
                "key": "ACP_DSW_FEATURE_UPDATE_SUPPORT",
                "value": false
            },
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key": "ACP_DSW_TRAINING_XDM_SCHEMA",
                "value": "{SEE BELOW FOR DETAILS}"
            },
            {
                "key": "evaluation.labelColumn",
                "value": "weeklySalesAhead"
            },
            {
                "key": "evaluation.metrics",
                "value": "MAPE,MAE,RMSE,MASE"
            }
        ]
    },
    {
        "name": "score",
        "parameters": [
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key":"ACP_DSW_SCORING_RESULTS_XDM_SCHEMA",
                "value":"{SEE BELOW FOR DETAILS}"
            }
        ]
    }
]
参数键 类型 描述
learning_rate 数值 梯度乘的标量。
n_estimators 数值 随机林分类器的林中树的数量。
max_depth 数值 随机林分类器中树的最大深度。
ACP_DSW_INPUT_FEATURES 字符串 以逗号分隔的输入架构属性列表。
ACP_DSW_TARGET_FEATURES 字符串 以逗号分隔的输出架构属性列表。
ACP_DSW_FEATURE_UPDATE_SUPPORT 布尔型 确定输入和输出功能是否可修改
tenantId 字符串 此ID可确保您创建的资源具有正确命名空间,并包含在您的IMS组织中。 按照此处的步骤操作 以查找租户ID。
ACP_DSW_TRAINING_XDM_SCHEMA 字符串 用于培训模型的输入模式。 在UI中导入时,将此参数留空,在使用API导入时,将替换为培训架构ID。
evaluation.labelColumn 字符串 用于评估可视化的列标签。
evaluation.metrics 字符串 用于评估模型的评估量度列表(以逗号分隔)。
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA 字符串 用于对模型进行评分的输出架构。 在UI中导入时,将此参数留空,在使用API导入时,将替换为评分模式ID。

在本教程中,您可以将零售销售方法的默认配置文件保留在 Data Science Workspace 引用它们的方式。

导入基于Docker的方法 — Python

首先,导航并选择 工作流 位于 Platform UI。 接下来,选择 导入方法 选择 Launch.

配置 页面 导入方法 工作流。 输入处方的名称和说明,然后选择 下一个 中。

配置工作流

注意

将源文件打包到方法中 教程中,在使用Python源文件构建零售销售方法结束时提供了Docker URL。

一旦你在 选择源 ,请粘贴与使用 Python 源文件(位于 源URL 字段。 接下来,通过拖放导入提供的配置文件,或使用文件系统 浏览器. 提供的配置文件可在 experience-platform-dsw-reference/recipes/python/retail/retail.config.json. 选择 Python运行时 下拉和 分类类型 下拉。 填写完所有内容后,选择 下一个 中,以继续 管理架构.

注意

类型支持 分类回归. 如果模型不属于这些类型之一,请选择 自定义.

接下来,在部分下选择零售销售输入和输出架构 管理架构,则是使用 创建零售销售架构和数据集 教程。

功能管理 部分,在架构查看器中选择租户标识以展开零售销售输入架构。 通过突出显示所需特征并选择任一特征来选择输入和输出特征 输入功能Target功能 在右侧 字段属性 窗口。 在本教程中,请将 weeklySales 作为 Target功能 其他一切 输入功能. 选择 下一个 来查看新配置的方法。

根据需要查看方法、添加、修改或删除配置。 选择 完成 创建方法。

转到 后续步骤 了解如何在 Data Science Workspace 使用新创建的零售销售方法。

导入基于Docker的方法 — R

首先,导航并选择 工作流 位于 Platform UI。 接下来,选择 导入方法 选择 Launch.

配置 页面 导入方法 工作流。 输入处方的名称和说明,然后选择 下一个 中。

配置工作流

注意

将源文件打包到方法中 教程中,在使用R源文件构建零售销售方法结束时提供了Docker URL。

一旦你在 选择源 ,请在 源URL 字段。 接下来,通过拖放导入提供的配置文件,或使用文件系统 浏览器. 提供的配置文件可在 experience-platform-dsw-reference/recipes/R/Retail\ -\ GradientBoosting/retail.config.json. 选择 R运行时 下拉和 分类类型 下拉。 填写完所有内容后,选择 下一个 中,以继续 管理架构.

注意

类型 支持 分类回归. 如果模型不属于这些类型之一,请选择 自定义.

接下来,在部分下选择零售销售输入和输出架构 管理架构,则是使用 创建零售销售架构和数据集 教程。

功能管理 部分,在架构查看器中选择租户标识以展开零售销售输入架构。 通过突出显示所需特征并选择任一特征来选择输入和输出特征 输入功能Target功能 在右侧 字段属性 窗口。 在本教程中,请将 weeklySales 作为 Target功能 其他一切 输入功能. 选择 下一个 以查看新的“配置”方法。

根据需要查看方法、添加、修改或删除配置。 选择 完成 创建方法。

转到 后续步骤 了解如何在 Data Science Workspace 使用新创建的零售销售方法。

导入基于Docker的方法 — PySpark

首先,导航并选择 工作流 位于 Platform UI。 接下来,选择 导入方法 选择 Launch.

配置 页面 导入方法 工作流。 输入处方的名称和说明,然后选择 下一个 的问题。

配置工作流

注意

将源文件打包到方法中 教程中,在使用PySpark源文件构建零售销售方法结束时提供了Docker URL。

一旦你在 选择源 ,请将与使用PySpark源文件构建的打包方法对应的Docker URL粘贴到 源URL 字段。 接下来,通过拖放导入提供的配置文件,或使用文件系统 浏览器. 提供的配置文件可在 experience-platform-dsw-reference/recipes/pyspark/retail/pipeline.json. 选择 PySpark运行时 下拉。 选择PySpark运行时后,默认对象会自动填充到 Docker. 接下来,选择 分类类型 下拉。 填写完所有内容后,选择 下一个 中,以继续 管理架构.

注意

类型 支持 分类回归. 如果模型不属于这些类型之一,请选择 自定义.

接下来,使用 管理架构 选择器中,使用提供的引导脚本创建了架构,该脚本位于 创建零售销售架构和数据集 教程。

管理模式

功能管理 部分,在架构查看器中选择租户标识以展开零售销售输入架构。 通过突出显示所需特征并选择任一特征来选择输入和输出特征 输入功能Target功能 在右侧 字段属性 窗口。 在本教程中,请将 weeklySales 作为 Target功能 其他一切 输入功能. 选择 下一个 来查看新配置的方法。

根据需要查看方法、添加、修改或删除配置。 选择 完成 创建方法。

转到 后续步骤 了解如何在 Data Science Workspace 使用新创建的零售销售方法。

导入基于Docker的方法 — Scala

首先,导航并选择 工作流 位于 Platform UI。 接下来,选择 导入方法 选择 Launch.

配置 页面 导入方法 工作流。 输入处方的名称和说明,然后选择 下一个 的问题。

配置工作流

注意

将源文件打包到方法中 教程中,在使用Scala(Spark)源文件。

一旦你在 选择源 ,请在“源URL”字段中粘贴与使用Scala源文件构建的打包方法对应的Docker URL。 接下来,通过拖放操作导入提供的配置文件,或使用文件系统浏览器。 提供的配置文件可在 experience-platform-dsw-reference/recipes/scala/retail/pipelineservice.json. 选择 火花运行时 下拉。 一旦 Spark 运行时被选中,默认对象会自动填充到 Docker. 接下来,选择 回归类型 下拉。 填写完所有内容后,选择 下一个 中,以继续 管理架构.

注意

类型支持 分类回归. 如果模型不属于这些类型之一,请选择 自定义.

接下来,使用 管理架构 选择器中,使用提供的引导脚本创建了架构,该脚本位于 创建零售销售架构和数据集 教程。

管理模式

功能管理 部分,在架构查看器中选择租户标识以展开零售销售输入架构。 通过突出显示所需特征并选择任一特征来选择输入和输出特征 输入功能Target功能 在右侧 字段属性 窗口。 在本教程中,请将“weeklySales”作为 Target功能 其他一切 输入功能. 选择 下一个 来查看新配置的方法。

根据需要查看方法、添加、修改或删除配置。 选择 完成 创建方法。

转到 后续步骤 了解如何在 Data Science Workspace 使用新创建的零售销售方法。

后续步骤

本教程对如何配置方法并将其导入提供了分析 Data Science Workspace. 您现在可以使用新创建的方法创建、训练和评估模型。

在此页面上