Importer une recette assemblée dans l’interface utilisateur de l’espace de travail Data Science Workspace

Ce tutoriel explique comment configurer et importer une recette empaquetée à l’aide de l’exemple de ventes au détail fourni. Après avoir terminé ce tutoriel, vous serez prêt à créer, à former et à évaluer un modèle dans Adobe Experience Platform Data Science Workspace.

Conditions préalables

Ce didacticiel nécessite une recette empaquetée sous la forme d'une URL d'image Docker. Pour plus d’informations, consultez le tutoriel expliquant comment Former une recette empaquetée à partir de fichiers source.

Workflow de l’interface utilisateur

L'importation d'une recette empaquetée dans Data Science Workspace nécessite des configurations de recette spécifiques, compilées dans un seul fichier JSON (JavaScript Object Notation), cette compilation de configurations de recette est appelée fichier de configuration. Une recette empaquetée avec un ensemble particulier de configurations est appelée instance de recette. Une recette peut être utilisée pour créer de nombreuses instances de recette dans Data Science Workspace.

Voici les différentes étapes du workflow d’importation d’une recette empaquetée :

Configuration d’une recette

Chaque instance de recette dans Data Science Workspace est accompagnée d'un ensemble de configurations qui adaptent l'instance de recette à un cas d'utilisation particulier. Les fichiers de configuration définissent les comportements de formation et de notation par défaut d’un modèle créé à l’aide de cette instance de recette.

REMARQUE

Les fichiers de configuration sont spécifiques à la recette et au cas.

Vous trouverez ci-dessous un échantillon de fichier de configuration présentant les comportements de formation et de notation par défaut de la recette Ventes au détail.

[
    {
        "name": "train",
        "parameters": [
            {
                "key": "learning_rate",
                "value": "0.1"  
            },
            {
                "key": "n_estimators",
                "value": "100"
            },
            {
                "key": "max_depth",
                "value": "3"
            },
            {
                "key": "ACP_DSW_INPUT_FEATURES",
                "value": "date,store,storeType,storeSize,temperature,regionalFuelPrice,markdown,cpi,unemployment,isHoliday"
            },
            {
                "key": "ACP_DSW_TARGET_FEATURES",
                "value": "weeklySales"
            },
            {
                "key": "ACP_DSW_FEATURE_UPDATE_SUPPORT",
                "value": false
            },
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key": "ACP_DSW_TRAINING_XDM_SCHEMA",
                "value": "{SEE BELOW FOR DETAILS}"
            },
            {
                "key": "evaluation.labelColumn",
                "value": "weeklySalesAhead"
            },
            {
                "key": "evaluation.metrics",
                "value": "MAPE,MAE,RMSE,MASE"
            }
        ]
    },
    {
        "name": "score",
        "parameters": [
            {
                "key": "tenantId",
                "value": "_{TENANT_ID}"
            },
            {
                "key":"ACP_DSW_SCORING_RESULTS_XDM_SCHEMA",
                "value":"{SEE BELOW FOR DETAILS}"
            }
        ]
    }
]
Clé paramètre Type Description
learning_rate Nombre Scalaire pour la multiplication des gradients.
n_estimators Nombre Nombre d’arbres dans la forêt pour le classificateur Forêt aléatoire.
max_depth Nombre Profondeur maximale d’un arbre dans le classificateur Forêt aléatoire.
ACP_DSW_INPUT_FEATURES Chaîne Liste d’attributs de schéma d’entrée séparés par des virgules.
ACP_DSW_TARGET_FEATURES Chaîne Liste d’attributs de schéma de sortie séparés par des virgules.
ACP_DSW_FEATURE_UPDATE_SUPPORT Booléen Détermine si les fonctionnalités d’entrée et de sortie peuvent être modifiées.
tenantId Chaîne Cet identifiant permet de garantir que les ressources que vous créez sont des espaces de noms corrects et contenus dans votre organisation IMS. Suivez ces étapes pour trouver votre identifiant client.
ACP_DSW_TRAINING_XDM_SCHEMA Chaîne Le schéma d’entrée utilisé pour la formation d’un modèle. Laissez ce champ vide lors de l’importation dans l’interface utilisateur ; remplacez-le par l’identifiant du schéma de formation lors de l’importation à l’aide de l’API.
evaluation.labelColumn Chaîne Libellé de colonne pour visualiser les évaluations.
evaluation.metrics Chaîne Liste de mesures d’évaluation séparées par des virgules à utiliser pour l’évaluation d’un modèle.
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA Chaîne Le schéma de sortie utilisé pour la notation d’un modèle. Laissez ce champ vide lors de l’importation dans l’interface utilisateur ; remplacez-le par l’identifiant du schéma de notation lors de l’importation à l’aide de l’API.

Pour les besoins de ce didacticiel, vous pouvez laisser les fichiers de configuration par défaut pour la recette Ventes au détail dans la référence Data Science Workspace de la manière dont ils sont.

Importation d’une recette Docker - Python

Début en naviguant et en sélectionnant Workflows dans le coin supérieur gauche de l'interface utilisateur Platform. Ensuite, sélectionnez Importer la recette et sélectionnez Lancer.

La page Configurer du flux de travaux Importer la recette s'affiche. Entrez un nom et une description pour la recette, puis sélectionnez Suivant dans le coin supérieur droit.

configurer le workflow

REMARQUE

Dans le tutoriel Former une recette empaquetée à partir de fichiers source, une URL Docker a été fournie à la fin de la création de la recette Ventes au détail à l’aide de fichiers source Python.

Une fois que vous êtes sur la page Sélectionner la source, collez l'URL du Docker correspondant à la recette assemblée générée à l'aide des fichiers source Python dans le champ URL de la source. Importez ensuite le fichier de configuration fourni en le faisant glisser et en le déposant, ou utilisez le Navigateur du système de fichiers. Le fichier de configuration fourni se trouve ici : experience-platform-dsw-reference/recipes/python/retail/retail.config.json. Sélectionnez Python dans la liste déroulante Runtime et Classification dans la liste déroulante Type. Une fois que tout a été rempli, sélectionnez Suivant dans le coin supérieur droit pour passer à Gérer les schémas.

REMARQUE

Type prend en charge Classification et Régression. Si votre modèle ne tombe pas sous l'un de ces types, sélectionnez Personnalisé.

Ensuite, sélectionnez les schémas d'entrée et de sortie des ventes au détail sous la section Gérer les Schémas, ils ont été créés à l'aide du script d'amorçage fourni dans le didacticiel créer le schéma de vente au détail et le jeu de données.

Dans la section Gestion des fonctionnalités, sélectionnez sur votre identification de client dans le lecteur de schéma pour développer le schéma d’entrée Ventes au détail. Sélectionnez les fonctionnalités d’entrée et de sortie en mettant en surbrillance la fonctionnalité souhaitée, puis sélectionnez Fonctionnalité d’entrée ou Fonctionnalité cible dans la fenêtre Propriétés du champ à droite. Pour les besoins de ce tutoriel, définissez weeklySales en tant que Fonctionnalité cible et tout le reste en tant que Fonctionnalité d’entrée. Sélectionnez Suivant pour examiner votre nouvelle recette configurée.

Vérifiez la recette, ajoutez, modifiez ou supprimez des configurations si nécessaire. Sélectionnez Finish pour créer la recette.

Passez aux étapes suivantes pour savoir comment créer un modèle dans Data Science Workspace à l'aide de la recette de vente au détail nouvellement créée.

Importation d’une recette Docker - R

Début en naviguant et en sélectionnant Workflows dans le coin supérieur gauche de l'interface utilisateur Platform. Ensuite, sélectionnez Importer la recette et sélectionnez Lancer.

La page Configurer du flux de travaux Importer la recette s'affiche. Entrez un nom et une description pour la recette, puis sélectionnez Suivant dans le coin supérieur droit.

configurer le workflow

REMARQUE

Dans le tutoriel Former une recette empaquetée à partir de fichiers source, une URL Docker a été fournie à la fin de la création de la recette Ventes au détail à l’aide de fichiers source R.

Une fois que vous êtes sur la page Sélectionner la source, collez l'URL du Docker correspondant à la recette assemblée générée à l'aide des fichiers source R dans le champ URL source. Importez ensuite le fichier de configuration fourni en le faisant glisser et en le déposant, ou utilisez le Navigateur du système de fichiers. Le fichier de configuration fourni se trouve ici : experience-platform-dsw-reference/recipes/R/Retail\ -\ GradientBoosting/retail.config.json. Sélectionnez R dans la liste déroulante Exécution et Classification dans la liste déroulante Type. Une fois que tout a été rempli, sélectionnez Suivant dans le coin supérieur droit pour passer à Gérer les schémas.

REMARQUE

Typesupports Classification et Régression. Si votre modèle ne tombe pas sous l'un de ces types, sélectionnez​Personnalisé**.

Ensuite, sélectionnez les schémas d'entrée et de sortie des ventes au détail sous la section Gérer les Schémas, ils ont été créés à l'aide du script d'amorçage fourni dans le didacticiel créer le schéma de vente au détail et le jeu de données.

Dans la section Gestion des fonctionnalités, sélectionnez sur votre identification de client dans le lecteur de schéma pour développer le schéma d’entrée Ventes au détail. Sélectionnez les fonctionnalités d’entrée et de sortie en mettant en surbrillance la fonctionnalité souhaitée, puis sélectionnez Fonctionnalité d’entrée ou Fonctionnalité cible dans la fenêtre Propriétés du champ à droite. Pour les besoins de ce tutoriel, définissez weeklySales en tant que Fonctionnalité cible et tout le reste en tant que Fonctionnalité d’entrée. Sélectionnez Suivant pour examiner votre nouvelle recette configurée.

Vérifiez la recette, ajoutez, modifiez ou supprimez des configurations si nécessaire. Sélectionnez Finish pour créer la recette.

Passez aux étapes suivantes pour savoir comment créer un modèle dans Data Science Workspace à l'aide de la recette de vente au détail nouvellement créée.

Recette basée sur un Docker d'importation - PySpark

Début en naviguant et en sélectionnant Workflows dans le coin supérieur gauche de l'interface utilisateur Platform. Ensuite, sélectionnez Importer la recette et sélectionnez Lancer.

La page Configurer du flux de travaux Importer la recette s'affiche. Entrez un nom et une description pour la recette, puis sélectionnez Suivant dans le coin supérieur droit pour continuer.

configurer le workflow

REMARQUE

Dans le didacticiel Package des fichiers source dans une recette, une URL Docker a été fournie à la fin de la création de la recette Ventes au détail à l’aide des fichiers source PySpark.

Une fois que vous êtes sur la page Sélectionner la source, collez l'URL du Docker correspondant à la recette assemblée générée à l'aide des fichiers source PySpark dans le champ URL de la source. Importez ensuite le fichier de configuration fourni en le faisant glisser et en le déposant, ou utilisez le Navigateur du système de fichiers. Le fichier de configuration fourni se trouve ici : experience-platform-dsw-reference/recipes/pyspark/retail/pipeline.json. Sélectionnez PySpark dans la liste déroulante Runtime. Une fois que le runtime PySpark est sélectionné, l'artefact par défaut est automatiquement renseigné sur Docker. Ensuite, sélectionnez Classification dans la liste déroulante Type. Une fois que tout a été rempli, sélectionnez Suivant dans le coin supérieur droit pour passer à Gérer les schémas.

REMARQUE

Typesupports Classification et Régression. Si votre modèle ne tombe pas sous l'un de ces types, sélectionnez​Personnalisé**.

Ensuite, sélectionnez les schémas d'entrée et de sortie des ventes au détail à l'aide du sélecteur Gérer les Schémas, les schémas ont été créés à l'aide du script d'amorçage fourni dans le didacticiel créer le schéma de vente au détail et le jeu de données.

gérer les schémas

Dans la section Gestion des fonctionnalités, sélectionnez sur votre identification de client dans le lecteur de schéma pour développer le schéma d’entrée Ventes au détail. Sélectionnez les fonctionnalités d’entrée et de sortie en mettant en surbrillance la fonctionnalité souhaitée, puis sélectionnez Fonctionnalité d’entrée ou Fonctionnalité cible dans la fenêtre Propriétés du champ à droite. Pour les besoins de ce tutoriel, définissez weeklySales en tant que Fonctionnalité cible et tout le reste en tant que Fonctionnalité d’entrée. Sélectionnez Suivant pour examiner votre nouvelle recette configurée.

Vérifiez la recette, ajoutez, modifiez ou supprimez des configurations si nécessaire. Sélectionnez Finish pour créer la recette.

Passez aux étapes suivantes pour savoir comment créer un modèle dans Data Science Workspace à l'aide de la recette de vente au détail nouvellement créée.

Recette basée sur un Docker d'importation - Scala

Début en naviguant et en sélectionnant Workflows dans le coin supérieur gauche de l'interface utilisateur Platform. Ensuite, sélectionnez Importer la recette et sélectionnez Lancer.

La page Configurer du flux de travaux Importer la recette s'affiche. Entrez un nom et une description pour la recette, puis sélectionnez Suivant dans le coin supérieur droit pour continuer.

configurer le workflow

REMARQUE

Dans le didacticiel compresser les fichiers source dans une recette, une URL Docker a été fournie à la fin de la création de la recette de vente au détail à l’aide des fichiers source Scala (Spark).

Une fois que vous êtes sur la page Sélectionner la source, collez l'URL du Docker correspondant à la recette assemblée générée à l'aide des fichiers source Scala dans le champ URL source. Importez ensuite le fichier de configuration fourni en le faisant glisser et en le déposant, ou utilisez le Navigateur du système de fichiers. Le fichier de configuration fourni se trouve ici : experience-platform-dsw-reference/recipes/scala/retail/pipelineservice.json. Sélectionnez Spark dans la liste déroulante Exécution. Une fois l'exécution Spark sélectionnée, l'artefact par défaut est automatiquement renseigné en Docker. Ensuite, sélectionnez Régression dans la liste déroulante Type. Une fois que tout a été rempli, sélectionnez Suivant dans le coin supérieur droit pour passer à Gérer les schémas.

REMARQUE

Type prend en charge Classification et Régression. Si votre modèle ne tombe pas sous l'un de ces types, sélectionnez Personnalisé.

Ensuite, sélectionnez les schémas d'entrée et de sortie des ventes au détail à l'aide du sélecteur Gérer les Schémas, les schémas ont été créés à l'aide du script d'amorçage fourni dans le didacticiel créer le schéma de vente au détail et le jeu de données.

gérer les schémas

Dans la section Gestion des fonctionnalités, sélectionnez sur votre identification de client dans le lecteur de schéma pour développer le schéma d’entrée Ventes au détail. Sélectionnez les fonctionnalités d’entrée et de sortie en mettant en surbrillance la fonctionnalité souhaitée, puis sélectionnez Fonctionnalité d’entrée ou Fonctionnalité cible dans la fenêtre Propriétés du champ à droite. Pour les besoins de ce didacticiel, définissez "weeklySales" comme Fonction de Cible et tout le reste comme Fonction d'entrée. Sélectionnez Suivant pour examiner votre nouvelle recette configurée.

Vérifiez la recette, ajoutez, modifiez ou supprimez des configurations si nécessaire. Sélectionnez Finish pour créer la recette.

Passez aux étapes suivantes pour savoir comment créer un modèle dans Data Science Workspace à l'aide de la recette de vente au détail nouvellement créée.

Étapes suivantes

Ce didacticiel fournit des informations sur la configuration et l'importation d'une recette dans Data Science Workspace. Vous pouvez désormais créer, former et évaluer un modèle à l’aide de la nouvelle recette créée.

Sur cette page