Création et publication d’un modèle d’apprentissage automatique

Imaginons que vous possédez un site web de vente en ligne. Lorsque vos clients achètent sur votre site web de vente en ligne, vous souhaitez leur présenter des recommandations de produits personnalisées afin d’exposer une variété d’autres produits proposés par votre entreprise. Au cours de l’existence de votre site web, vous avez continuellement rassemblé des données clients et souhaitez utiliser ces données d’une manière ou d’une autre pour générer des recommandations de produits personnalisées.

Adobe Experience Platform Data Science Workspace fournit les moyens d’atteindre votre objectif à l’aide de la recette Recommendations de produit prédéfinie. Suivez ce tutoriel pour découvrir comment accéder à vos données de vente au détail et les comprendre, créer et optimiser un modèle d’apprentissage automatique et générer des insights dans Data Science Workspace.

Ce tutoriel reflète le processus de Data Science Workspace et couvre les étapes suivantes pour créer un modèle d’apprentissage automatique :

  1. Préparation de vos données
  2. Création de votre modèle
  3. Formation et évaluation de votre modèle
  4. Exploitation de votre modèle

Prise en main

Avant de commencer ce tutoriel, vous devez disposer des éléments suivants :

  • Accès à Adobe Experience Platform. Si vous n’avez pas accès à une organisation IMS dans Experience Platform, contactez votre administrateur système avant de poursuivre.

  • Ressources d’activation. Contactez le représentant de votre compte pour que les éléments suivants soient mis en service.

    • Recette des recommandations
    • Jeu de données d’entrée des recommandations
    • Schéma d’entrée des recommandations
    • Jeu de données de sortie des recommandations
    • Schéma de sortie des recommandations
    • Valeurs de publication du jeu de données favori
    • Schéma du jeu de données favori
  • Téléchargez les trois fichiers Jupyter Notebook requis à partir du référentiel Git Adobe public. Ils serviront à démontrer le workflow JupyterLab dans Data Science Workspace.

Une connaissance concrète des concepts clés suivants employés dans ce tutoriel :

  • Experience Data Model: L’effort de normalisation conduit par Adobe pour définir des schémas standard tels que Profile et ExperienceEvent, pour la gestion de l’expérience client.
  • Jeux de données : construction de stockage et de gestion pour les données réelles. Instance instanciée physique d’un schéma XDM.
  • Lots : les jeux de données sont constitués de lots. Un lot est un ensemble de données collectées sur une période donnée et traitées ensemble comme une seule unité.
  • JupyterLab: JupyterLab est une interface web open source pour Project Jupyter et est étroitement intégrée à Experience Platform.

Préparation de vos données

Pour créer un modèle d’apprentissage automatique qui recommande des produits personnalisés à vos clients, vous devez analyser les achats précédents de clients sur votre site web. Cette section explique comment ces données sont ingérées dans Platform par Adobe Analytics et comment elles sont transformées en jeu de données de fonctionnalités à utiliser par votre modèle d’apprentissage automatique.

Exploration des données et compréhension des schémas

Connectez-vous à Adobe Experience Platform et sélectionnez Jeux de données pour répertorier tous les jeux de données existants et sélectionner le jeu de données que vous souhaitez explorer. Dans ce cas, le Analytics jeu de données Valeurs de publication du jeu de données favori.

La page d’activité du jeu de données s’ouvre, répertoriant les informations relatives à votre jeu de données. Vous pouvez sélectionner Aperçu du jeu de données près du coin supérieur droit pour examiner les exemples d’enregistrements. Vous pouvez également afficher le schéma du jeu de données sélectionné. Sélectionnez le lien du schéma dans le rail droit. Une fenêtre contextuelle s’affiche, en sélectionnant le lien sous nom du schéma pour ouvrir le schéma dans un nouvel onglet.

Les autres jeux de données ont été préremplis avec des lots à des fins d’aperçu. Vous pouvez afficher ces jeux de données en répétant les étapes ci-dessus.

Nom du jeu de données Schéma Description
Valeurs de publication du jeu de données favori Schéma du jeu de données favori AnalyticsDonnées source de votre site web
Jeu de données d’entrée des recommandations Schéma d’entrée des recommandations Les données Analytics sont transformées en jeu de données d’apprentissage à l’aide d’un pipeline de fonctionnalités. Ces données sont utilisées pour former le modèle d’apprentissage automatique de recommandations de produits. itemid et userid correspondent à un produit acheté par ce client.
Jeu de données de sortie des recommandations Schéma de sortie des recommandations Le jeu de données pour lequel les résultats de notation sont stockés contient la liste des produits recommandés pour chaque client.

Création de votre modèle

Le deuxième composant du cycle de vie Data Science Workspace implique la création de recettes et de modèles. La recette des recommandations de produits est conçue pour générer des recommandations de produits à grande échelle en utilisant les données d’achats antérieurs et l’apprentissage automatique.

Les recettes sont la base d’un modèle puisqu’elles contiennent des algorithmes d’apprentissage automatique et une logique conçue pour résoudre des problèmes spécifiques. Plus important encore, les recettes vous permettent de démocratiser l’apprentissage automatique au sein de votre organisation, en permettant à d’autres utilisateurs d’accéder à un modèle pour des cas d’utilisation variés sans devoir coder.

Exploration de la recette des recommandations de produits

Dans Experience Platform, accédez à Modèles dans la colonne de navigation de gauche, puis sélectionnez Recettes dans la barre de navigation supérieure pour afficher la liste des recettes disponibles pour votre organisation.

Recherchez et ouvrez ensuite la recette Recommendations fournie en sélectionnant son nom. La page de présentation de la recette s’affiche.

Ensuite, dans le rail de droite, sélectionnez Recommendations Input Schema pour afficher le schéma qui alimente la recette. Les champs de schéma "itemId" et "userId" correspondent à un produit acheté (interactionType) par ce client à un moment spécifique (horodatage). Suivez les mêmes étapes pour consulter le Schéma de sortie des recommandations.

Vous avez maintenant examiné les schémas d’entrée et de sortie requis par la recette des recommandations de produits. Passez à la section suivante pour savoir comment créer, former et évaluer un modèle Recommendations de produit.

Formation et évaluation de votre modèle

Maintenant que vos données sont préparées et que la recette est prête, vous pouvez créer, former et évaluer votre modèle d’apprentissage automatique.

Création d’un modèle

Un modèle est une instance de recette qui permet l’entraînement et l’évaluation de données à grande échelle.

Dans Experience Platform, accédez à Modèles dans la colonne de navigation de gauche, puis sélectionnez Recettes dans la barre de navigation supérieure. Elle affiche une liste des recettes disponibles pour votre organisation. Sélectionnez la recette de recommandation de produit.

Sur la page de recette, sélectionnez Créer un modèle.

créer un modèle

Le processus de création de modèle commence par la sélection d’une recette. Sélectionnez la recette Recommendations , puis sélectionnez Suivant dans le coin supérieur droit.

Indiquez ensuite un nom de modèle. Les configurations disponibles pour le modèle sont répertoriées avec des paramètres pour les comportements de formation et de notation par défaut du modèle. Vérifiez les configurations et sélectionnez Terminer.

Vous êtes redirigé vers la page d’aperçu de vos modèles avec une nouvelle session d’entraînement. Une session d’entraînement est générée par défaut lors de la création d’un modèle.

Vous pouvez choisir d’attendre la fin de la session d’entraînement ou continuer à créer une session d’entraînement dans la section suivante.

Entraînement du modèle à l’aide d’hyperparamètres personnalisés

Sur la page Aperçu du modèle, sélectionnez Former près du coin supérieur droit pour créer une nouvelle opération de formation. Sélectionnez le même jeu de données d’entrée que celui utilisé lors de la création du modèle et sélectionnez Suivant.

La page de configuration s’affiche. Ici, vous pouvez configurer la valeur des exécutions de formation num_recommendations, également appelée hyperparamètre. Un modèle formé et optimisé utilisera les hyperparamètres les plus performants en fonction des résultats de l’opération de formation.

Les hyperparamètres ne peuvent pas être appris. Par conséquent, ils doivent être attribués avant les sessions d’entraînement. Le réglage d’hyperparamètres peut modifier la précision du modèle formé. L’optimisation d’un modèle étant un processus itératif, plusieurs opérations de formation peuvent être nécessaires avant qu’une évaluation satisfaisante ne soit réalisée.

CONSEIL

Définissez num_recommendations sur 10.

D’autres points de données s’affichent sur le graphique d’évaluation du modèle. Cette opération peut prendre plusieurs minutes une fois l’exécution terminée.

Évaluation du modèle

Chaque fois qu’une session d’entraînement se termine, vous pouvez afficher les mesures d’évaluation qui en résultent pour déterminer l’efficacité du modèle.

Pour passer en revue les mesures d’évaluation (précision et rappel) pour chaque session d’entraînement terminée, sélectionnez la session d’entraînement.

Vous pouvez explorer les informations fournies pour chaque mesure d’évaluation. Plus ces mesures sont élevées, plus le modèle est performant.

Vous pouvez voir le jeu de données, les schémas et les paramètres de configuration utilisés pour chaque session d’entraînement sur le rail droit. Revenez à la page Modèle et identifiez les sessions d’entraînement les plus performantes en observant leurs mesures d’évaluation.

Exploitation de votre modèle

La dernière étape du workflow Data Science consiste à rendre opérationnel votre modèle afin de recueillir et d’exploiter les insights de votre banque de données.

Évaluation et génération d’insights

Sur la page d’aperçu du modèle de recommandations de produits, sélectionnez le nom de la session d’entraînement la plus performante, avec les valeurs de rappel et de précision les plus élevées.

noter la meilleure opération

Ensuite, en haut à droite de la page des détails de l’opération de formation, sélectionnez Score.

sélectionner un score

Sélectionnez ensuite le jeu de données d’entrée Recommendations comme jeu de données d’entrée de notation, qui est le même jeu de données que celui utilisé lors de la création du modèle et de l’exécution de ses opérations de formation. Sélectionnez ensuite Suivant.

Une fois que vous disposez de votre jeu de données d’entrée, sélectionnez le jeu de données de sortie Recommendations comme jeu de données de sortie de notation. Les résultats de notation sont stockés dans ce jeu de données sous la forme d’un lot.

Enfin, passez en revue les configurations de notation. Ces paramètres contiennent les jeux de données d’entrée et de sortie que vous avez sélectionnés précédemment, ainsi que les schémas appropriés. Sélectionnez Terminer pour lancer l’opération de notation. Cela peut prendre plusieurs minutes.

Affichage des insights évalués

Une fois l’opération de notation terminée, vous pouvez prévisualiser les résultats et afficher les informations générées.

Sur la page des opérations de notation, sélectionnez l’opération de notation terminée, puis sélectionnez Aperçu du jeu de données des résultats de la notation sur le rail de droite.

Dans le tableau de prévisualisation, chaque ligne contient des recommandations de produits pour un client en particulier, respectivement libellés recommendations et userId. Puisque l’hyperparamètre num_recommendations a été défini sur 10 dans les exemples de captures d’écran, chaque ligne de recommandations peut contenir jusqu’à 10 identités de produit délimitées par un signe dièse (#).

Étapes suivantes

Ce tutoriel vous a présenté le workflow de Data Science Workspace, en montrant comment les données brutes non traitées peuvent être transformées en informations utiles grâce à l’apprentissage automatique. Pour en savoir plus sur l’utilisation de Data Science Workspace, consultez le guide suivant sur la création du schéma et du jeu de données des ventes au détail.

Sur cette page