以下各节提供了Sensei Machine Learning API的各种功能的参考信息。
Sensei Machine Learning API支持检索资产时的查询参数。 下表介绍了可用查询参数及其用法:
查询参数 | 描述 | 默认值 |
---|---|---|
start |
指示分页的起始索引。 | start=0 |
limit |
指示要返回的最大结果数。 | limit=25 |
orderby |
指示按优先级顺序进行排序的属性。 在属性名称前加入虚线(-)以按降序排序,否则结果按升序排序。 | orderby=created |
property |
指示要返回对象必须满足的比较表达式。 | property=deleted==false |
组合多个查询参数时,必须用&符号(&)分隔。
Python引擎能够在CPU或GPU之间进行选择以用于其培训或评分,并在MLInstance上定义为任务规范(tasks.specification
)。
以下是一个示例配置,它指定使用CPU进行培训,使用GPU进行评分:
[
{
"name": "train",
"parameters": [
{
"key": "training parameter",
"value": "parameter value"
}
],
"specification": {
"type": "ContainerTaskSpec",
"cpus": "1"
}
},
{
"name": "score",
"parameters": [
{
"key": "scoring parameter",
"value": "parameter value"
}
],
"specification": {
"type": "ContainerTaskSpec",
"gpus": "1"
}
}
]
cpus
和gpus
的值不表示CPU或GPU的数量,而表示物理计算机的数量。 这些值可以"1"
使用,否则将引发异常。
Spark Engine能够修改计算资源,用于培训和评分。 下表介绍了这些资源:
资源 | 描述 | 类型 |
---|---|---|
driverMemory | 驱动程序的内存(MB) | int |
driverCores | 驱动程序使用的核数 | int |
executorMemory | 执行器的存储器(MB) | int |
executorCores | 执行器使用的核数 | int |
numExecutors | 执行者数 | int |
可以在MLInstance上指定资源,作为(A)单个培训或评分参数,或(B)其他规范对象(specification
)中的资源。 例如,以下资源配置对于培训和评分都是相同的:
[
{
"name": "train",
"parameters": [
{
"key": "driverMemory",
"value": "2048"
},
{
"key": "driverCores",
"value": "1"
},
{
"key": "executorMemory",
"value": "2048"
},
{
"key": "executorCores",
"value": "2"
},
{
"key": "numExecutors",
"value": "3"
}
]
},
{
"name": "score",
"parameters": [
{
"key": "scoring parameter",
"value": "parameter value"
}
],
"specification": {
"type": "SparkTaskSpec",
"name": "Spark Task name",
"className": "Class name",
"driverMemoryInMB": 2048,
"driverCores": 1,
"executorMemoryInMB": 2048,
"executorCores": 2,
"numExecutors": 3
}
}
]