文档 Experience Platform 数据科学 Workspace 指南

Sensei Machine Learning API指南附录

Last update: Tue Aug 06 2024 00:00:00 GMT+0000 (Coordinated Universal Time)

主题：
Data Science Workspace

创建对象：

开发人员

NOTE

Data Science Workspace不再可购买。

本文档面向之前有权访问数据科学Workspace的现有客户。

以下部分提供Sensei Machine Learning API各种功能的参考信息。

用于资源检索的查询参数 query

Sensei Machine Learning API为检索资产的查询参数提供支持。下表描述了可用的查询参数及其用法：

查询参数

描述

默认值

start

指示分页的起始索引。

start=0

limit

指示要返回的最大结果数。

limit=25

orderby

指示用于按优先级排序的属性。在属性名称前包含破折号(-)可按降序排序，否则结果将按升序排序。

orderby=created

property

指示对象必须满足才能返回的比较表达式。

property=deleted==false

NOTE

组合多个查询参数时，必须用&符号(&)分隔。

Python CPU和GPU配置 cpu-gpu-config

Python引擎能够在CPU或GPU之间进行选择，用于训练或评分，并在MLInstance上定义为任务规范(tasks.specification)。

以下是一个示例配置，它指定使用CPU进行训练，使用GPU进行评分：

[
    {
        "name": "train",
        "parameters": [
            {
                "key": "training parameter",
                "value": "parameter value"
            }
        ],
        "specification": {
            "type": "ContainerTaskSpec",
            "cpus": "1"
        }
    },
    {
        "name": "score",
        "parameters": [
            {
                "key": "scoring parameter",
                "value": "parameter value"
            }
        ],
        "specification": {
            "type": "ContainerTaskSpec",
            "gpus": "1"
        }
    }
]

NOTE

cpus和gpus的值不表示CPU或GPU的数量，而是表示物理计算机的数量。这些值许可为"1"，否则将引发异常。

PySpark和Spark资源配置 resource-config

Spark Engines能够修改计算资源以进行培训和评分。下表介绍了这些资源：

资源

描述

类型

driveremory

驱动程序的内存(MB)

int

driverCores

驱动程序使用的内核数

int

executorMemory

执行器的内存(MB)

int

executorCores

执行器使用的内核数

int

numExecuters

执行者数量

int

可在MLInstance上将资源指定为(A)单独的训练或评分参数，或(B)在附加规范对象(specification)中。例如，以下资源配置对于训练和评分都是相同的：

[
    {
        "name": "train",
        "parameters": [
            {
                "key": "driverMemory",
                "value": "2048"
            },
            {
                "key": "driverCores",
                "value": "1"
            },
            {
                "key": "executorMemory",
                "value": "2048"
            },
            {
                "key": "executorCores",
                "value": "2"
            },
            {
                "key": "numExecutors",
                "value": "3"
            }
        ]
    },
    {
        "name": "score",
        "parameters": [
            {
                "key": "scoring parameter",
                "value": "parameter value"
            }
        ],
        "specification": {
            "type": "SparkTaskSpec",
            "name": "Spark Task name",
            "className": "Class name",
            "driverMemoryInMB": 2048,
            "driverCores": 1,
            "executorMemoryInMB": 2048,
            "executorCores": 2,
            "numExecutors": 3
        }
    }
]

recommendation-more-help

cc79fe26-64da-411e-a6b9-5b650f53e4e9