使用Sensei Machine Learning API训练和评估模型
本教程将向您展示如何使用API调用创建、训练和评估模型。 有关API文档的详细列表,请参阅此文档。
先决条件
按照使用API导入打包的方法创建引擎,使用API训练和评估模型需要该引擎。
按照Experience PlatformAPI身份验证教程开始进行API调用。
在本教程中,您现在应该具有以下值:
-
{ACCESS_TOKEN}
:在身份验证后提供的特定持有者令牌值。 -
{ORG_ID}
:在独特的Adobe Experience Platform集成中找到您的组织凭据。 -
{API_KEY}
:在您的唯一Adobe Experience Platform集成中找到您的特定API密钥值。 -
链接到智能服务的Docker图像
API工作流程
我们将使用API创建用于培训的实验运行。 在本教程中,我们将重点介绍“引擎”、“实例”和“试验”端点。 下图概括了三者之间的关系,并介绍了“运行”和“模型”的概念。
创建MLInstance
可以使用以下请求来创建MLInstance。 您将使用通过使用API导入打包的Recipe教程创建引擎时返回的{ENGINE_ID}
。
请求
curl -X POST \
https://platform.adobe.io/data/sensei/mlInstances \
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'Content-Type: application/vnd.adobe.platform.sensei+json;profile=mlInstance.v1.json' \
-H 'x-api-key: {API_KEY}' \
-H 'x-gw-ims-org-id: {ORG_ID}' \
-d `{JSON_PAYLOAD}`
{ACCESS_TOKEN}
:在身份验证后提供的特定持有者令牌值。{ORG_ID}
:在独特的Adobe Experience Platform集成中找到您的组织凭据。{API_KEY}
:在您的唯一Adobe Experience Platform集成中找到您的特定API密钥值。{JSON_PAYLOAD}
:MLInstance的配置。 我们在本教程中使用的示例如下所示:
{
"name": "Retail - Instance",
"description": "Instance for ML Instance",
"engineId": "{ENGINE_ID}",
"createdBy": {
"displayName": "John Doe",
"userId": "johnd"
},
"tags": {
"purpose": "tutorial"
},
"tasks": [
{
"name": "train",
"parameters": [
{
"key": "numFeatures",
"value": "10"
},
{
"key": "maxIter",
"value": "2"
},
{
"key": "regParam",
"value": "0.15"
},
{
"key": "trainingDataLocation",
"value": "sample_training_data.csv"
}
]
},
{
"name": "score",
"parameters": [
{
"key": "scoringDataLocation",
"value": "sample_scoring_data.csv"
},
{
"key": "scoringResultsLocation",
"value": "scoring_results.net"
}
]
}
]
}
{JSON_PAYLOAD}
中,我们定义在tasks
数组中用于训练和计分的参数。 {ENGINE_ID}
是要使用的引擎的ID,tag
字段是用于标识实例的可选参数。响应包含{INSTANCE_ID}
,它表示创建的MLInstance。 可以创建具有不同配置的多模型MLInstance。
响应
{
"id": "{INSTANCE_ID}",
"name": "Retail - Instance",
"description": "Instance for ML Instance",
"engineId": "{ENGINE_ID}",
"created": "2018-21-21T11:11:11.111Z",
"createdBy": {
"displayName": "John Doe",
"userId": "johnd"
},
"updated": "2018-21-01T11:11:11.111Z",
"deleted": false,
"tags": {
"purpose": "tutorial"
},
"tasks": [
{
"name": "train",
"parameters": [...]
},
{
"name": "score",
"parameters": [...]
}
]
}
{ENGINE_ID}
:此ID表示在其中创建MLInstance的引擎。{INSTANCE_ID}
:表示MLInstance的ID。
创建试验
数据科学家在训练时使用实验来得出一个高性能的模型。 多项实验包括更改数据集、功能、学习参数和硬件。 下面是创建“试验”的示例。
请求
curl -X POST \
https://platform.adobe.io/data/sensei/experiments \
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'Content-Type: application/vnd.adobe.platform.sensei+json;profile=experiment.v1.json' \
-H 'x-gw-ims-org-id: {ORG_ID}' \
-H 'x-api-key: {API_KEY' \
-d `{JSON PAYLOAD}`
{ORG_ID}
:在您的唯一Adobe Experience Platform集成中找到您的组织凭据。{ACCESS_TOKEN}
:身份验证后提供的特定持有者令牌值。{API_KEY}
:在独特的Adobe Experience Platform集成中找到特定的API密钥值。{JSON_PAYLOAD}
:创建的试验对象。 我们在本教程中使用的示例如下所示:
{
"name": "Experiment for Retail ",
"mlInstanceId": "{INSTANCE_ID}",
"tags": {
"test": "guide"
}
}
{INSTANCE_ID}
:表示MLInstance的ID。
Experiment创建的响应如下所示。
响应
{
"id": "{EXPERIMENT_ID}",
"name": "Experiment for Retail",
"mlInstanceId": "{INSTANCE_ID}",
"created": "2018-01-01T11:11:11.111Z",
"updated": "2018-01-01T11:11:11.111Z",
"deleted": false,
"tags": {
"test": "guide"
}
}
{EXPERIMENT_ID}
:表示您刚刚创建的实验的ID。{INSTANCE_ID}
:表示MLInstance的ID。
创建计划的培训试验
使用计划的实验,因此我们不需要通过API调用创建每个单独的实验运行。 相反,我们在试验创建期间提供了所有必需的参数,每次运行都将定期创建。
为了指示创建计划试验,我们必须在请求正文中添加template
部分。 在template
中,包括计划运行的所有必要参数,例如tasks
和schedule
,前者表示什么操作,后者表示计划运行的时间。
请求
curl -X POST \
https://platform.adobe.io/data/sensei/experiments \
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'Content-Type: application/vnd.adobe.platform.sensei+json;profile=experiment.v1.json' \
-H 'x-gw-ims-org-id: {ORG_ID}' \
-H 'x-api-key: {API_KEY}' \
-d '{JSON_PAYLOAD}`
{ORG_ID}
:在您的唯一Adobe Experience Platform集成中找到您的组织凭据。{ACCESS_TOKEN}
:在身份验证后提供的特定持有者令牌值。{API_KEY}
:在独特的Adobe Experience Platform集成中找到特定的API密钥值。{JSON_PAYLOAD}
:要发布的数据集。 我们在本教程中使用的示例如下所示:
{
"name": "Experiment for Retail",
"mlInstanceId": "{INSTANCE_ID}",
"template": {
"tasks": [{
"name": "train",
"parameters": [
{
"value": "1000",
"key": "numFeatures"
}
],
"specification": {
"type": "SparkTaskSpec",
"executorCores": 5,
"numExecutors": 5
}
}],
"schedule": {
"cron": "*/20 * * * *",
"startTime": "2018-11-11",
"endTime": "2019-11-11"
}
}
}
创建试验时,正文{JSON_PAYLOAD}
应包含mlInstanceId
或mlInstanceQuery
参数。 在此示例中,计划试验将调用从startTime
到endTime
的每20分钟运行一次(在cron
参数中设置)。
响应
{
"id": "{EXPERIMENT_ID}",
"name": "Experiment for Retail",
"mlInstanceId": "{INSTANCE_ID}",
"created": "2018-11-11T11:11:11.111Z",
"updated": "2018-11-11T11:11:11.111Z",
"deleted": false,
"workflowId": "endid123_0379bc0b_8f7e_4706_bcd9_1a2s3d4f5g_abcdf",
"template": {
"tasks": [
{
"name": "train",
"parameters": [...],
"specification": {
"type": "SparkTaskSpec",
"executorCores": 5,
"numExecutors": 5
}
}
],
"schedule": {
"cron": "*/20 * * * *",
"startTime": "2018-07-04",
"endTime": "2018-07-06"
}
}
}
{EXPERIMENT_ID}
:表示试验的ID。{INSTANCE_ID}
:表示MLInstance的ID。
创建用于训练的试验运行
在创建试验实体后,可以使用以下调用创建并运行训练运行。 您将需要{EXPERIMENT_ID}
并指明要在请求正文中触发的mode
。
请求
curl -X POST \
https://platform.adobe.io/data/sensei/experiments/{EXPERIMENT_ID}/runs \
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'Content-Type: application/vnd.adobe.platform.sensei+json;profile=experimentRun.v1.json' \
-H 'x-gw-ims-org-id: {ORG_ID}' \
-H 'x-api-key: {API_KEY}' \
-d '{JSON_PAYLOAD}'
{EXPERIMENT_ID}
:与要作为目标的实验对应的ID。 可在创建实验时的响应中找到。{ORG_ID}
:在您的唯一Adobe Experience Platform集成中找到您的组织凭据。{ACCESS_TOKEN}
:身份验证后提供的特定持有者令牌值。{API_KEY}
:在您的唯一Adobe Experience Platform集成中找到您的特定API密钥值。{JSON_PAYLOAD}
:要创建训练运行,您必须在正文中包含以下内容:
{
"mode":"Train"
}
还可以通过包含tasks
数组来覆盖配置参数:
{
"mode":"Train",
"tasks": [
{
"name": "train",
"parameters": [
{
"key": "numFeatures",
"value": "2"
}
]
}
]
}
您会收到以下响应,让您了解{EXPERIMENT_RUN_ID}
和tasks
下的配置。
响应
{
"id": "{EXPERIMENT_RUN_ID}",
"mode": "train",
"experimentId": "{EXPERIMENT_ID}",
"created": "2018-01-01T11:11:11.903Z",
"updated": "2018-01-01T11:11:11.903Z",
"deleted": false,
"tasks": [
{
"name": "Train",
"parameters": [...]
}
]
}
{EXPERIMENT_RUN_ID}
:表示试验运行的ID。{EXPERIMENT_ID}
:表示实验运行所在实验的ID。
检索试验运行状态
可使用{EXPERIMENT_RUN_ID}
查询实验运行的状态。
请求
curl -X GET \
https://platform.adobe.io/data/sensei/experiments/{EXPERIMENT_ID}/runs/{EXPERIMENT_RUN_ID}/status \
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'x-gw-ims-org-id: {ORG_ID}' \
-H 'x-api-key: {API_KEY}'
{EXPERIMENT_ID}
:表示试验的ID。{EXPERIMENT_RUN_ID}
:表示试验运行的ID。{ACCESS_TOKEN}
:身份验证后提供的特定持有者令牌值。{ORG_ID}
:在您的唯一Adobe Experience Platform集成中找到您的组织凭据。{API_KEY}
:在独特的Adobe Experience Platform集成中找到特定的API密钥值。
响应
GET调用将在state
参数中提供状态,如下所示:
{
"id": "{EXPERIMENT_ID}",
"name": "RunStatus for experimentRunId {EXPERIMENT_RUN_ID}",
"experimentRunId": "{EXPERIMENT_RUN_ID}",
"deleted": false,
"status": {
"tasks": [
{
"id": "{MODEL_ID}",
"state": "DONE",
"tasklogs": [
{
"name": "execution",
"url": "https://mlbaprod1sapwd7jzid.file.core.windows.net/..."
},
{
"name": "stderr",
"url": "https://mlbaprod1sapwd7jzid.file.core.windows.net/..."
},
{
"name": "stdout",
"url": "https://mlbaprod1sapwd7jzid.file.core.windows.net/..."
}
]
}
]
}
}
{EXPERIMENT_RUN_ID}
:表示试验运行的ID。{EXPERIMENT_ID}
:表示实验运行所在实验的ID。
除了DONE
状态之外,其他状态还包括:
PENDING
RUNNING
FAILED
若要获取详细信息,可在tasklogs
参数下找到详细日志。
检索经过培训的模型
为了得到上述训练中创建的训练模型,我们提出以下要求:
请求
curl -X GET \
'https://platform.adobe.io/data/sensei/models/?property=experimentRunId=={EXPERIMENT_RUN_ID}' \
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'x-gw-ims-org-id: {ORG_ID}'
{EXPERIMENT_RUN_ID}
:与要作为目标的实验运行相对应的ID。 可在创建实验运行时的响应中找到。{ACCESS_TOKEN}
:身份验证后提供的特定持有者令牌值。{ORG_ID}
:在您的唯一Adobe Experience Platform集成中找到您的组织凭据。
响应表示创建的已训练模型。
响应
{
"children": [
{
"id": "{MODEL_ID}",
"name": "Tutorial trained Model",
"experimentId": "{EXPERIMENT_ID}",
"experimentRunId": "{EXPERIMENT_RUN_ID}",
"description": "trained model for ID",
"modelArtifactUri": "wasb://test-models@mlpreprodstorage.blob.core.windows.net/{MODEL_ID}",
"created": "2018-01-01T11:11:11.011Z",
"updated": "2018-01-01T11:11:11.011Z",
"deleted": false
}
],
"_page": {
"property": "ExperimentRunId=={EXPERIMENT_RUN_ID},deleted!=true",
"count": 1
}
}
{MODEL_ID}
:与模型对应的ID。{EXPERIMENT_ID}
:与试验运行对应的ID位于。{EXPERIMENT_RUN_ID}
:与试验运行对应的ID。
停止并删除计划的试验
如果要在计划试验endTime
之前停止执行它,可以通过查询{EXPERIMENT_ID}
的DELETE请求来完成
请求
curl -X DELETE \
'https://platform.adobe.io/data/sensei/experiments/{EXPERIMENT_ID}' \
-H 'Authorization: Bearer {ACCESS_TOKEN}' \
-H 'x-gw-ims-org-id: {ORG_ID}'
{EXPERIMENT_ID}
:与试验对应的ID。{ACCESS_TOKEN}
:身份验证后提供的特定持有者令牌值。{ORG_ID}
:在您的唯一Adobe Experience Platform集成中找到您的组织凭据。
以下是“响应”,通知已成功删除试验。
响应
{
"title": "Success",
"status": 200,
"detail": "Experiment successfully deleted"
}
后续步骤
本教程介绍了如何使用API创建引擎、实验、计划的实验运行和经过培训的模型。 在下一个练习中,您将通过使用表现最好的训练模型来评分新数据集以进行预测。