以下部分提供各种功能的参考信息 Sensei Machine Learning API。
此 Sensei Machine Learning API为检索资产的查询参数提供支持。 下表描述了可用的查询参数及其用法:
查询参数 | 描述 | 默认值 |
---|---|---|
start |
指示分页的起始索引。 | start=0 |
limit |
指示要返回的最大结果数。 | limit=25 |
orderby |
指示用于按优先级排序的属性。 包含短划线(-),属性名称之前将按降序排序,否则结果将按升序排序。 | orderby=created |
property |
指示对象必须满足才能返回的比较表达式。 | property=deleted==false |
组合多个查询参数时,必须使用&符号(和)。
Python引擎能够选择CPU或GPU以进行训练或评分,并且在 MLInstance 作为任务规范(tasks.specification
)。
以下是指定使用CPU进行训练和GPU进行评分的示例配置:
[
{
"name": "train",
"parameters": [
{
"key": "training parameter",
"value": "parameter value"
}
],
"specification": {
"type": "ContainerTaskSpec",
"cpus": "1"
}
},
{
"name": "score",
"parameters": [
{
"key": "scoring parameter",
"value": "parameter value"
}
],
"specification": {
"type": "ContainerTaskSpec",
"gpus": "1"
}
}
]
的值 cpus
和 gpus
并不表示CPU或GPU的数量,而是表示物理机的数量。 这些值是允许的 "1"
否则,和将引发异常。
Spark引擎能够修改计算资源以进行训练和评分。 下表介绍了这些资源:
资源 | 描述 | 类型 |
---|---|---|
drivermemory | 驱动程序内存(MB) | int |
driverCores | 驱动程序使用的内核数 | int |
executorMemory | 执行器的内存(MB) | int |
executorCores | 执行器使用的内核数 | int |
numExecuters | 执行者数量 | int |
资源可在 MLInstance 作为(A)单独的训练或评分参数,或(B)在附加的规范对象内(specification
)。 例如,以下资源配置对于训练和评分都是相同的:
[
{
"name": "train",
"parameters": [
{
"key": "driverMemory",
"value": "2048"
},
{
"key": "driverCores",
"value": "1"
},
{
"key": "executorMemory",
"value": "2048"
},
{
"key": "executorCores",
"value": "2"
},
{
"key": "numExecutors",
"value": "3"
}
]
},
{
"name": "score",
"parameters": [
{
"key": "scoring parameter",
"value": "parameter value"
}
],
"specification": {
"type": "SparkTaskSpec",
"name": "Spark Task name",
"className": "Class name",
"driverMemoryInMB": 2048,
"driverCores": 1,
"executorMemoryInMB": 2048,
"executorCores": 2,
"numExecutors": 3
}
}
]