Sensei Machine Learning API를 사용하여 모델 트레이닝 및 평가

이 자습서에서는 API 호출을 사용하여 모델을 생성, 교육 및 평가하는 방법을 보여 줍니다. API 설명서에 대한 자세한 목록은 이 문서를 참조하십시오.

전제 조건

API를 사용하여 모델을 트레이닝하고 평가하는 데 필요한 API🔗를 사용하여 패키징된 레서피를 가져옵니다.

Experience Platform API 인증 자습서에 따라 API 호출을 시작합니다.

이제 튜토리얼에서 다음 값을 가져야 합니다.

  • {ACCESS_TOKEN}:인증 후 제공된 특정 베어러 토큰 값입니다.

  • {IMS_ORG}:고유한 Adobe Experience Platform 통합에서 찾은 IMS 조직 자격 증명

  • {API_KEY}:고유한 Adobe Experience Platform 통합에 있는 특정 API 키 값입니다.

  • 지능형 서비스의 Docker 이미지에 연결

API 작업 과정

API를 사용하여 트레이닝을 위한 실험 실행을 만듭니다. 이 튜토리얼에서는 엔진, MLInessions 및 실험 끝점에 중점을 둡니다. 다음 차트에서는 세 가지 사이의 관계를 설명하고 Run과 Model의 개념을 소개합니다.

노트

"Engine", "MLInstance", "MLService", "Experience" 및 "Model"은 UI에서 다른 용어로 언급됩니다. UI에서 오는 경우 다음 표에서는 차이점을 매핑합니다.

UI 용어 API 용어
레서피 엔진
모델 MLInstance
교육 실행 실험
서비스 MLService

MLInstance 만들기

다음 요청을 사용하여 MLInstance를 만들 수 있습니다. API 튜토리얼을 사용하여 패키징된 레서피 가져오기에서 엔진을 만들 때 반환된 {ENGINE_ID}을 사용하게 됩니다.

요청

curl -X POST \
  https://platform.adobe.io/data/sensei/mlInstances \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'Content-Type: application/vnd.adobe.platform.sensei+json;profile=mlInstance.v1.json' \
  -H 'x-api-key: {API_KEY}' \
  -H 'x-gw-ims-org-id: {IMS_ORG}' \
  -d `{JSON_PAYLOAD}`

{ACCESS_TOKEN}:인증 후 제공된 특정 베어러 토큰 값입니다.
{IMS_ORG}:고유한 Adobe Experience Platform 통합에서 찾은 IMS 조직 자격 증명
{API_KEY}:고유한 Adobe Experience Platform 통합에 있는 특정 API 키 값입니다.
{JSON_PAYLOAD}:MLInstance 구성 튜토리얼에서 사용하는 예는 다음과 같습니다.

{
    "name": "Retail - Instance",
    "description": "Instance for ML Instance",
    "engineId": "{ENGINE_ID}",
    "createdBy": {
        "displayName": "John Doe",
        "userId": "johnd"
    },
    "tags": {
        "purpose": "tutorial"
    },
    "tasks": [
        {
            "name": "train",
            "parameters": [
                {
                    "key": "numFeatures",
                    "value": "10"
                },
                {
                    "key": "maxIter",
                    "value": "2"
                },
                {
                    "key": "regParam",
                    "value": "0.15"
                },
                {
                    "key": "trainingDataLocation",
                    "value": "sample_training_data.csv"
                }
            ]
        },
        {
            "name": "score",
            "parameters": [
                {
                    "key": "scoringDataLocation",
                    "value": "sample_scoring_data.csv"
                },
                {
                    "key": "scoringResultsLocation",
                    "value": "scoring_results.net"
                }
            ]
        }
    ]
}
노트

{JSON_PAYLOAD}에서는 tasks 배열에서 트레이닝 및 점수에 사용되는 매개 변수를 정의합니다. {ENGINE_ID}은 사용할 엔진의 ID이고 tag 필드는 인스턴스를 식별하는 데 사용되는 선택적 매개 변수입니다.

응답에는 만들어진 MLInstance를 나타내는 {INSTANCE_ID}이 포함됩니다. 구성이 다른 여러 모델 MLInestment를 만들 수 있습니다.

응답

{
    "id": "{INSTANCE_ID}",
    "name": "Retail - Instance",
    "description": "Instance for ML Instance",
    "engineId": "{ENGINE_ID}",
    "created": "2018-21-21T11:11:11.111Z",
    "createdBy": {
        "displayName": "John Doe",
        "userId": "johnd"
    },
    "updated": "2018-21-01T11:11:11.111Z",
    "deleted": false,
    "tags": {
        "purpose": "tutorial"
    },
    "tasks": [
        {
            "name": "train",
            "parameters": [...]
        },
        {
            "name": "score",
            "parameters": [...]
        }
    ]
}

{ENGINE_ID}:MLInstance가 생성되는 엔진을 나타내는 이 ID입니다.
{INSTANCE_ID}:MLInstance를 나타내는 ID입니다.

실험 만들기

실험은 데이터 과학자가 훈련 중에 높은 성취도 모델에 도달하는 데 사용됩니다. 데이터 세트, 기능, 학습 매개 변수 및 하드웨어를 변경하는 여러 가지 실험도 포함되어 있습니다. 실험 만들기의 예는 다음과 같습니다.

요청

curl -X POST \
  https://platform.adobe.io/data/sensei/experiments \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'Content-Type: application/vnd.adobe.platform.sensei+json;profile=experiment.v1.json' \
  -H 'x-gw-ims-org-id: {IMS_ORG}' \
  -H 'x-api-key: {API_KEY' \
  -d `{JSON PAYLOAD}`

{IMS_ORG}:고유한 Adobe Experience Platform 통합에서 찾은 IMS 조직 자격 증명
{ACCESS_TOKEN}:인증 후 제공된 특정 베어러 토큰 값입니다.
{API_KEY}:고유한 Adobe Experience Platform 통합에 있는 특정 API 키 값입니다.
{JSON_PAYLOAD}:만들어진 객체를 실험합니다. 튜토리얼에서 사용하는 예는 다음과 같습니다.

{
    "name": "Experiment for Retail ",
    "mlInstanceId": "{INSTANCE_ID}",
    "tags": {
        "test": "guide"
    }
}

{INSTANCE_ID}:MLInstance를 나타내는 ID입니다.

실험 생성의 응답은 다음과 같습니다.

응답

{
    "id": "{EXPERIMENT_ID}",
    "name": "Experiment for Retail",
    "mlInstanceId": "{INSTANCE_ID}",
    "created": "2018-01-01T11:11:11.111Z",
    "updated": "2018-01-01T11:11:11.111Z",
    "deleted": false,
    "tags": {
        "test": "guide"
    }
}

{EXPERIMENT_ID}:방금 만든 실험을 나타내는 ID입니다.
{INSTANCE_ID}:MLInstance를 나타내는 ID입니다.

예약된 교육 실험 만들기

API 호출을 통해 각 단일 실험 실행을 만들 필요가 없도록 예약된 실험이 사용됩니다. 대신 실험 생성 중에 필요한 모든 매개변수를 제공하며 각 실행은 정기적으로 생성됩니다.

예약된 실험 만들기를 나타내려면 요청 본문에 template 섹션을 추가해야 합니다. template에서는 어떤 작업을 나타낼지 나타내는 tasks 및 예약된 실행의 타이밍을 나타내는 schedule 등과 같이, 실행을 예약하기 위해 필요한 모든 매개 변수가 포함됩니다.

요청

curl -X POST \
  https://platform.adobe.io/data/sensei/experiments \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'Content-Type: application/vnd.adobe.platform.sensei+json;profile=experiment.v1.json' \
  -H 'x-gw-ims-org-id: {IMS_ORG}' \
  -H 'x-api-key: {API_KEY}' \
  -d '{JSON_PAYLOAD}`

{IMS_ORG}:고유한 Adobe Experience Platform 통합에서 찾은 IMS 조직 자격 증명
{ACCESS_TOKEN}:인증 후 제공된 특정 베어러 토큰 값입니다.
{API_KEY}:고유한 Adobe Experience Platform 통합에 있는 특정 API 키 값입니다.
{JSON_PAYLOAD}:게시할 데이터 세트입니다. 튜토리얼에서 사용하는 예는 다음과 같습니다.

{
    "name": "Experiment for Retail",
    "mlInstanceId": "{INSTANCE_ID}",
    "template": {
        "tasks": [{
            "name": "train",
            "parameters": [
                   {
                        "value": "1000",
                        "key": "numFeatures"
                    }
            ],
            "specification": {
                "type": "SparkTaskSpec",
                "executorCores": 5,
                "numExecutors": 5
            }
        }],
        "schedule": {
            "cron": "*/20 * * * *",
            "startTime": "2018-11-11",
            "endTime": "2019-11-11"
        }
    }
}

실험 생성 시 본문인 {JSON_PAYLOAD}mlInstanceId 또는 mlInstanceQuery 매개 변수를 포함해야 합니다. 이 예에서 예약된 실험은 startTime부터 endTime까지 cron 매개 변수에 설정된 20분마다 실행을 호출합니다.

응답

{
    "id": "{EXPERIMENT_ID}",
    "name": "Experiment for Retail",
    "mlInstanceId": "{INSTANCE_ID}",
    "created": "2018-11-11T11:11:11.111Z",
    "updated": "2018-11-11T11:11:11.111Z",
    "deleted": false,
    "workflowId": "endid123_0379bc0b_8f7e_4706_bcd9_1a2s3d4f5g_abcdf",
    "template": {
        "tasks": [
            {
                "name": "train",
                "parameters": [...],
                "specification": {
                    "type": "SparkTaskSpec",
                    "executorCores": 5,
                    "numExecutors": 5
                }
            }
        ],
        "schedule": {
            "cron": "*/20 * * * *",
            "startTime": "2018-07-04",
            "endTime": "2018-07-06"
        }
    }
}

{EXPERIMENT_ID}:실험을 나타내는 ID.
{INSTANCE_ID}:MLInstance를 나타내는 ID입니다.

트레이닝을 위한 실험 실행 만들기

실험 엔티티를 만든 경우 아래 호출을 사용하여 교육 실행을 만들고 실행할 수 있습니다. {EXPERIMENT_ID}이 필요하며 요청 본문에 트리거할 mode을(를) 표시합니다.

요청

curl -X POST \
  https://platform.adobe.io/data/sensei/experiments/{EXPERIMENT_ID}/runs \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'Content-Type: application/vnd.adobe.platform.sensei+json;profile=experimentRun.v1.json' \
  -H 'x-gw-ims-org-id: {IMS_ORG}' \
  -H 'x-api-key: {API_KEY}' \
  -d '{JSON_PAYLOAD}'

{EXPERIMENT_ID}:타깃팅할 실험에 해당하는 ID. 실험 생성 시 응답에서 찾을 수 있습니다.
{IMS_ORG}:고유한 Adobe Experience Platform 통합에서 찾은 IMS 조직 자격 증명
{ACCESS_TOKEN}:인증 후 제공된 특정 베어러 토큰 값입니다.
{API_KEY}:고유한 Adobe Experience Platform 통합에 있는 특정 API 키 값입니다.
{JSON_PAYLOAD}:교육 실행을 만들려면 본문에 다음을 포함해야 합니다.

{
    "mode":"Train"
}

tasks 배열을 포함하여 구성 매개 변수를 재정의할 수도 있습니다.

{
   "mode":"Train",
   "tasks": [
        {
           "name": "train",
           "parameters": [
                {
                   "key": "numFeatures",
                   "value": "2"
                }
            ]
        }
    ]
}

{EXPERIMENT_RUN_ID}tasks 아래의 구성을 알리는 다음 응답을 받게 됩니다.

응답

{
    "id": "{EXPERIMENT_RUN_ID}",
    "mode": "train",
    "experimentId": "{EXPERIMENT_ID}",
    "created": "2018-01-01T11:11:11.903Z",
    "updated": "2018-01-01T11:11:11.903Z",
    "deleted": false,
    "tasks": [
        {
            "name": "Train",
            "parameters": [...]
        }
    ]
}

{EXPERIMENT_RUN_ID}:실험 실행을 나타내는 ID입니다.
{EXPERIMENT_ID}:실험 실행 아래에 있는 실험을 나타내는 ID입니다.

실험 실행 상태 검색

실험 실행의 상태를 {EXPERIMENT_RUN_ID}으로 쿼리할 수 있습니다.

요청

curl -X GET \
  https://platform.adobe.io/data/sensei/experiments/{EXPERIMENT_ID}/runs/{EXPERIMENT_RUN_ID}/status \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'x-gw-ims-org-id: {IMS_ORG}' \
  -H 'x-api-key: {API_KEY}'

{EXPERIMENT_ID}:실험을 나타내는 ID.
{EXPERIMENT_RUN_ID}:실험 실행을 나타내는 ID입니다.
{ACCESS_TOKEN}:인증 후 제공된 특정 베어러 토큰 값입니다.
{IMS_ORG}:고유한 Adobe Experience Platform 통합에서 찾은 IMS 조직 자격 증명
{API_KEY}:고유한 Adobe Experience Platform 통합에 있는 특정 API 키 값입니다.

응답

GET 호출은 아래와 같이 state 매개 변수에 상태를 제공합니다.

{
    "id": "{EXPERIMENT_ID}",
    "name": "RunStatus for experimentRunId {EXPERIMENT_RUN_ID}",
    "experimentRunId": "{EXPERIMENT_RUN_ID}",
    "deleted": false,
    "status": {
        "tasks": [
            {
                "id": "{MODEL_ID}",
                "state": "DONE",
                "tasklogs": [
                    {
                        "name": "execution",
                        "url": "https://mlbaprod1sapwd7jzid.file.core.windows.net/..."
                    },
                    {
                        "name": "stderr",
                        "url": "https://mlbaprod1sapwd7jzid.file.core.windows.net/..."
                    },
                    {
                        "name": "stdout",
                        "url": "https://mlbaprod1sapwd7jzid.file.core.windows.net/..."
                    }
                ]
            }
        ]
    }
}

{EXPERIMENT_RUN_ID}:실험 실행을 나타내는 ID입니다.
{EXPERIMENT_ID}:실험 실행 아래에 있는 실험을 나타내는 ID입니다.

DONE 상태 이외에 다른 상태에는 다음이 포함됩니다.

  • PENDING
  • RUNNING
  • FAILED

자세한 정보를 보려면 tasklogs 매개 변수 아래에서 세부 로그를 찾을 수 있습니다.

훈련된 모델 읽어오기

교육 중에 위에서 만든 교육을 받은 모델을 받으려면 다음 요청을 합니다.

요청

curl -X GET \
  'https://platform.adobe.io/data/sensei/models/?property=experimentRunId=={EXPERIMENT_RUN_ID}' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'x-gw-ims-org-id: {IMS_ORG}'

{EXPERIMENT_RUN_ID}:대상으로 지정할 실험 실행에 해당하는 ID입니다. 실험 실행을 만들 때 응답에서 찾을 수 있습니다.
{ACCESS_TOKEN}:인증 후 제공된 특정 베어러 토큰 값입니다.
{IMS_ORG}:고유한 Adobe Experience Platform 통합에서 찾은 IMS 조직 자격 증명

이 응답은 만들어진 훈련된 모델을 나타냅니다.

응답

{
    "children": [
        {
            "id": "{MODEL_ID}",
            "name": "Tutorial trained Model",
            "experimentId": "{EXPERIMENT_ID}",
            "experimentRunId": "{EXPERIMENT_RUN_ID}",
            "description": "trained model for ID",
            "modelArtifactUri": "wasb://test-models@mlpreprodstorage.blob.core.windows.net/{MODEL_ID}",
            "created": "2018-01-01T11:11:11.011Z",
            "updated": "2018-01-01T11:11:11.011Z",
            "deleted": false
        }
    ],
    "_page": {
        "property": "ExperimentRunId=={EXPERIMENT_RUN_ID},deleted!=true",
        "count": 1
    }
}

{MODEL_ID}:모델에 해당하는 ID.
{EXPERIMENT_ID}:실험 실행(Experiment Run)에 해당하는 ID입니다.
{EXPERIMENT_RUN_ID}:실험 실행에 해당하는 ID입니다.

예약된 실험 중지 및 삭제

endTime 이전에 예약된 실험 실행을 중지하려는 경우 DELETE 요청을 {EXPERIMENT_ID}에 쿼리하여 수행할 수 있습니다.

요청

curl -X DELETE \
  'https://platform.adobe.io/data/sensei/experiments/{EXPERIMENT_ID}' \
  -H 'Authorization: Bearer {ACCESS_TOKEN}' \
  -H 'x-gw-ims-org-id: {IMS_ORG}'

{EXPERIMENT_ID}:실험 ID입니다.
{ACCESS_TOKEN}:인증 후 제공된 특정 베어러 토큰 값입니다.
{IMS_ORG}:고유한 Adobe Experience Platform 통합에서 찾은 IMS 조직 자격 증명

노트

API 호출에서는 새 Experiment 실행을 만들 수 없습니다. 하지만 이미 실행 중인 실험 실행의 실행을 중지하지 않습니다.

다음은 실험이 성공적으로 삭제되었음을 알리는 응답입니다.

응답

{
    "title": "Success",
    "status": 200,
    "detail": "Experiment successfully deleted"
}

다음 단계

이 자습서에서는 API를 사용하여 엔진, 실험, 예약된 실험 실행 및 트레이닝된 모델을 만드는 방법을 살펴봅니다. 다음 연습에서는 성과가 가장 높은 훈련된 상위 모델을 사용하여 새 데이터 세트에 점수를 매겨 예측하게 됩니다.

이 페이지에서는