Ce didacticiel fournit des instructions sur la manière de compresser les fichiers source d'exemples de ventes au détail fournis dans un fichier d'archive, qui peut être utilisé pour créer une recette dans Adobe Experience Platform Data Science Workspace en suivant le processus d'importation de la recette dans l'interface utilisateur ou à l'aide de l'API.
Concepts à comprendre :
La création de recettes commence par le regroupement des fichiers afin de créer un fichier d’archives. Les fichiers source définissent la logique d’apprentissage automatique et les algorithmes utilisés pour résoudre un problème spécifique à l’étude et sont écrits dans Python, R, PySpark ou Scala. Les fichiers d'archives créés prennent la forme d'une image Docker. Une fois créé, le fichier d'archive compressé est importé dans Data Science Workspace pour créer une recette dans l'interface utilisateur ou à l'aide de l'API.
Une image Docker permet au développeur d’empaqueter une application avec tous les éléments dont elle a besoin, comme les bibliothèques et autres dépendances, et de l’expédier sous forme d’un package unique.
L'image Docker construite est envoyée au Registre du Conteneur Azure à l'aide des informations d'identification qui vous ont été fournies pendant le processus de création de la recette.
Pour obtenir vos informations d’identification Azure Container Registry, connectez-vous à Adobe Experience Platform. Dans la colonne de navigation de gauche, accédez aux Workflows. Sélectionnez Importer la recette, puis Lancer. Voir la capture d’écran ci-dessous pour référence.
La page Configurer s'affiche. Indiquez un nom de recette approprié, par exemple « Recette des ventes au détail », et éventuellement une description ou une URL de documentation. Une fois terminé, cliquez sur Suivant.
Sélectionnez le runtime approprié, puis choisissez une classification pour Type. Les informations d'identification de votre Registre Azure Conteneur sont générées une fois l'opération terminée.
** Typeis est la classe de problème d'apprentissage automatique pour laquelle la recette est conçue et est utilisée après la formation pour aider à personnaliser l'évaluation de la course de formation.
Notez les valeurs de l'hôte Docker, du nom d'utilisateur et du mot de passe. Ils sont utilisés pour créer et pousser votre image Docker dans les workflows décrits ci-dessous.
L’URL source est fournie après avoir exécuté les étapes décrites ci-dessous. Le fichier de configuration est expliqué dans les didacticiels suivants, qui se trouvent dans étapes suivantes.
Commencez par obtenir l’exemple de code de base trouvé dans le référentiel Experience Platform Data Science Workspace Reference.
Si vous ne l'avez pas fait, clonez le référentiel GitHub sur votre système local avec la commande suivante :
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Accédez au répertoire experience-platform-dsw-reference/recipes/python/retail
. Vous trouverez ici les scripts login.sh
et build.sh
utilisés pour vous connecter à Docker et pour créer l'image Python Docker. Si vos informations d’identification Docker sont prêtes, saisissez les commandes suivantes dans l’ordre :
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Notez que lors de l'exécution du script de connexion, vous devez fournir l'hôte, le nom d'utilisateur et le mot de passe du Docker. Lors de la création, vous devez fournir l’hôte Docker et une balise de version pour la génération.
Une fois le script de génération terminé, vous recevez une URL de fichier source Docker dans la sortie de la console. Pour cet exemple spécifique, il se présente comme suit :
# URL format:
{DOCKER_HOST}/ml-retailsales-python:{VERSION_TAG}
Copiez cette URL et passez aux étapes suivantes.
Si vous ne l'avez pas fait, clonez le référentiel GitHub sur votre système local avec la commande suivante :
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Accédez au répertoire experience-platform-dsw-reference/recipes/R/Retail - GradientBoosting
dans votre référentiel cloné. Vous trouverez ici les fichiers login.sh
et build.sh
que vous utiliserez pour vous connecter à Docker et pour créer l'image R Docker. Si vos informations d’identification Docker sont prêtes, saisissez les commandes suivantes dans l’ordre :
# for logging in to Docker
./login.sh
# for build Docker image
./build.sh
Notez que lors de l'exécution du script de connexion, vous devez fournir l'hôte, le nom d'utilisateur et le mot de passe du Docker. Lors de la création, vous devez fournir l’hôte Docker et une balise de version pour la génération.
Une fois le script de génération terminé, vous recevez une URL de fichier source Docker dans la sortie de la console. Pour cet exemple spécifique, il se présente comme suit :
# URL format:
{DOCKER_HOST}/ml-retail-r:{VERSION_TAG}
Copiez cette URL et passez aux étapes suivantes.
Début en clonant le référentiel GitHub sur votre système local avec la commande suivante :
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Accédez au répertoire experience-platform-dsw-reference/recipes/pyspark/retail
. Les scripts login.sh
et build.sh
se trouvent ici et servent à se connecter au Docker et à créer l'image du Docker. Si vos informations d’identification Docker sont prêtes, saisissez les commandes suivantes dans l’ordre :
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Notez que lors de l'exécution du script de connexion, vous devez fournir l'hôte, le nom d'utilisateur et le mot de passe du Docker. Lors de la création, vous devez fournir l’hôte Docker et une balise de version pour la génération.
Une fois le script de génération terminé, vous recevez une URL de fichier source Docker dans la sortie de la console. Pour cet exemple spécifique, il se présente comme suit :
# URL format:
{DOCKER_HOST}/ml-retailsales-pyspark:{VERSION_TAG}
Copiez cette URL et passez aux étapes suivantes.
Début en clonant le référentiel GitHub sur votre système local avec la commande suivante en terminal :
git clone https://github.com/adobe/experience-platform-dsw-reference.git
Accédez ensuite au répertoire experience-platform-dsw-reference/recipes/scala
où vous trouverez les scripts login.sh
et build.sh
. Ces scripts sont utilisés pour se connecter au Docker et créer l'image du Docker. Si vos informations d'identification du Docker sont prêtes, entrez les commandes suivantes dans le terminal dans l'ordre :
# for logging in to Docker
./login.sh
# for building Docker image
./build.sh
Si vous recevez une erreur d'autorisation lors de la tentative de connexion au Docker à l'aide du script login.sh
, essayez d'utiliser la commande bash login.sh
.
Lors de l'exécution du script de connexion, vous devez indiquer l'hôte, le nom d'utilisateur et le mot de passe du Docker. Lors de la création, vous devez fournir l’hôte Docker et une balise de version pour la génération.
Une fois le script de génération terminé, vous recevez une URL de fichier source Docker dans la sortie de la console. Pour cet exemple spécifique, il se présente comme suit :
# URL format:
{DOCKER_HOST}/ml-retailsales-spark:{VERSION_TAG}
Copiez cette URL et passez aux étapes suivantes.
Ce tutoriel a passé en revue le regroupement de fichiers source dans une recette, étape préalable à l’importation d’une recette dans Data Science Workspace. Vous devez maintenant avoir une image Docker dans le Registre de Conteneur Azure avec l'URL d'image correspondante. Vous êtes maintenant prêt à commencer le didacticiel sur l'importation d'une recette emballée dans Data Science Workspace. Sélectionnez l’un des liens du tutoriel ci-dessous pour commencer: