DocumentationExperience PlatformGuide de Data Science Workspace

Sensei Machine Learning annexe du guide de l’API

Dernière mise à jour : 5 août 2024
  • Rubriques :
  • Découvrez comment créer le jeu de données et le schéma qui seront utilisés pour les reste du cours sur l’espace de travail de science des données

Créé pour :

  • Développeur
REMARQUE
Data Science Workspace ne peut plus être acheté.
Cette documentation est destinée aux clients existants disposant de droits antérieurs à Data Science Workspace.

Les sections suivantes fournissent des informations de référence pour différentes fonctionnalités de l’API Sensei Machine Learning.

Paramètres de requête pour la récupération de ressources

L’API Sensei Machine Learning prend en charge les paramètres de requête pour la récupération des ressources. Les paramètres de requête disponibles et leurs utilisations sont décrits dans le tableau suivant :

Paramètre de requêteDescriptionValeur par défaut
startIndique l’index de départ de pagination.start=0
limitIndique le nombre de résultats maximum à renvoyer.limit=25
orderbyIndique les propriétés à utiliser pour trier dans l’ordre de priorité. Incluez un tiret (-) devant un nom de propriété pour trier dans l’ordre décroissant. Dans le cas contraire, les résultats sont triés dans l’ordre croissant.orderby=created
propertyIndique l’expression de comparaison qu’un objet doit satisfaire pour être renvoyé.property=deleted==false
REMARQUE
Lorsque vous combinez plusieurs paramètres de requête, ils doivent être séparés par des esperluettes (&).

Configurations du processeur et du processeur graphique Python

Avec les moteurs Python, vous avez la possibilité de choisir entre un processeur ou un processeur graphique à des fins de formation ou de notation. Ceux-ci sont définis sur une MLInstance en tant que spécification de tâche (tasks.specification).

L’exemple suivant présente une configuration qui précise l’utilisation d’un processeur à des fins de formation et d’un processeur graphique à des fins de notation :

[
    {
        "name": "train",
        "parameters": [
            {
                "key": "training parameter",
                "value": "parameter value"
            }
        ],
        "specification": {
            "type": "ContainerTaskSpec",
            "cpus": "1"
        }
    },
    {
        "name": "score",
        "parameters": [
            {
                "key": "scoring parameter",
                "value": "parameter value"
            }
        ],
        "specification": {
            "type": "ContainerTaskSpec",
            "gpus": "1"
        }
    }
]
REMARQUE
Les valeurs cpus et gpus ne signifient pas le nombre de processeurs ou de processeurs graphiques, mais plutôt le nombre de machines physiques. Ces valeurs sont acceptablement "1" et renverront une exception dans le cas contraire.

Configurations des ressources PySpark et Spark

Les moteurs Spark permettent de modifier des ressources de calcul à des fins de formation et de notation. Ces ressources sont décrites dans le tableau suivant :

RessourceDescriptionType
driverMemoryMémoire du pilote en mégaoctetsent
driverCoresNombre de noyaux utilisés par le piloteent
executorMemoryMémoire de l’exécuteur en mégaoctetsent
executorCoresNombre de noyaux utilisés par l’exécuteurent
numExecutorsNombre d’exécuteursent

Vous pouvez préciser les ressources dans une MLInstance en tant que soit (A) en paramètres de formation ou de notation uniques, soit (B) au sein d’un objet de spécifications supplémentaire (specification). Par exemple, les configurations de ressource suivantes sont les mêmes aussi bien pour la formation que la notation :

[
    {
        "name": "train",
        "parameters": [
            {
                "key": "driverMemory",
                "value": "2048"
            },
            {
                "key": "driverCores",
                "value": "1"
            },
            {
                "key": "executorMemory",
                "value": "2048"
            },
            {
                "key": "executorCores",
                "value": "2"
            },
            {
                "key": "numExecutors",
                "value": "3"
            }
        ]
    },
    {
        "name": "score",
        "parameters": [
            {
                "key": "scoring parameter",
                "value": "parameter value"
            }
        ],
        "specification": {
            "type": "SparkTaskSpec",
            "name": "Spark Task name",
            "className": "Class name",
            "driverMemoryInMB": 2048,
            "driverCores": 1,
            "executorMemoryInMB": 2048,
            "executorCores": 2,
            "numExecutors": 3
        }
    }
]
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9