以下各节提供了 Sensei Machine Learning API。
的 Sensei Machine Learning API支持通过检索资产来查询参数。 下表介绍了可用查询参数及其用法:
查询参数 | 描述 | 默认值 |
---|---|---|
start |
指示分页的起始索引。 | start=0 |
limit |
指示要返回的结果的最大数量。 | limit=25 |
orderby |
指示按优先级顺序进行排序的属性。 包括短划线(-),以按降序排序,否则,结果将按升序排序。 | orderby=created |
property |
指示要返回对象必须满足的比较表达式。 | property=deleted==false |
组合多个查询参数时,必须用与号(&)。
Python引擎能够在CPU或GPU之间进行选择,以便进行培训或评分,并在 MLInstance 作为任务规范(tasks.specification
)。
以下是一个示例配置,它指定使用CPU进行培训,使用GPU进行评分:
[
{
"name": "train",
"parameters": [
{
"key": "training parameter",
"value": "parameter value"
}
],
"specification": {
"type": "ContainerTaskSpec",
"cpus": "1"
}
},
{
"name": "score",
"parameters": [
{
"key": "scoring parameter",
"value": "parameter value"
}
],
"specification": {
"type": "ContainerTaskSpec",
"gpus": "1"
}
}
]
的值 cpus
和 gpus
不表示CPU或GPU的数量,而是表示物理机的数量。 这些值是允许的 "1"
否则将引发异常。
Spark引擎能够修改计算资源,以便进行培训和评分。 下表介绍了这些资源:
资源 | 描述 | 类型 |
---|---|---|
driverMemory | 驱动程序内存(MB) | int |
driverCores | 驱动程序使用的内核数 | int |
executorMemory | 执行器的存储器(MB) | int |
executorCores | 执行器使用的内核数 | int |
numExecutors | 执行者数量 | int |
可以在 MLInstance 例如(A)单个培训或评分参数,或(B)附加规格对象(specification
)。 例如,以下资源配置对于培训和评分均相同:
[
{
"name": "train",
"parameters": [
{
"key": "driverMemory",
"value": "2048"
},
{
"key": "driverCores",
"value": "1"
},
{
"key": "executorMemory",
"value": "2048"
},
{
"key": "executorCores",
"value": "2"
},
{
"key": "numExecutors",
"value": "3"
}
]
},
{
"name": "score",
"parameters": [
{
"key": "scoring parameter",
"value": "parameter value"
}
],
"specification": {
"type": "SparkTaskSpec",
"name": "Spark Task name",
"className": "Class name",
"driverMemoryInMB": 2048,
"driverCores": 1,
"executorMemoryInMB": 2048,
"executorCores": 2,
"numExecutors": 3
}
}
]