Création et publication d’un modèle d’apprentissage automatique

Imaginons que vous possédez un site web de vente en ligne. Lorsque vos clients achètent sur votre site web de vente en ligne, vous souhaitez leur présenter des recommandations de produits personnalisées afin d’exposer une variété d’autres produits proposés par votre entreprise. Au cours de l’existence de votre site web, vous avez continuellement rassemblé des données clients et souhaitez utiliser ces données d’une manière ou d’une autre pour générer des recommandations de produits personnalisées.

Adobe Experience Platform Data Science Workspace fournit les moyens d'atteindre votre objectif à l'aide de la Recette du produit prédéfinie Recommendations. Suivez ce tutoriel pour découvrir comment accéder à vos données de vente au détail et les comprendre, créer et optimiser un modèle d’apprentissage automatique et générer des insights dans Data Science Workspace.

Ce didacticiel reflète le flux de travail de Data Science Workspace et décrit les étapes suivantes pour créer un modèle d’apprentissage automatique :

  1. Préparation de vos données
  2. Création de votre modèle
  3. Formation et évaluation de votre modèle
  4. Exploitation de votre modèle

Prise en main

Avant de commencer ce tutoriel, vous devez disposer des éléments suivants :

  • Accès à Adobe Experience Platform. Si vous n'avez pas accès à une organisation IMS dans Experience Platform, contactez votre administrateur système avant de continuer.

  • Ressources d’activation. Contactez le représentant de votre compte pour que les éléments suivants soient mis en service.

    • Recette des recommandations
    • Jeu de données d’entrée des recommandations
    • Schéma d’entrée des recommandations
    • Jeu de données de sortie des recommandations
    • Schéma de sortie des recommandations
    • Valeurs de publication du jeu de données favori
    • Schéma du jeu de données favori
  • Téléchargez les trois fichiers Jupyter Notebook requis à partir du référentiel Git public d'Adobe, qui seront utilisés pour démontrer le flux de travaux JupyterLab dans Data Science Workspace.

  • Une connaissance concrète des concepts clés suivants employés dans ce tutoriel :

    • Experience Data Model: L’effort de normalisation conduit par l’Adobe pour définir des schémas standard tels que Profile et ExperienceEvent, pour la gestion de l’expérience client.
    • Jeux de données : construction de stockage et de gestion pour les données réelles. Instance instanciée physique d’un schéma XDM.
    • Lots : les jeux de données sont constitués de lots. Un lot est un ensemble de données collectées sur une période donnée et traitées ensemble comme une seule unité.
    • JupyterLab: JupyterLab est une interface web open-source pour Project Jupyter et est étroitement intégrée dans Experience Platform.

Préparation de vos données

Pour créer un modèle d’apprentissage automatique qui recommande des produits personnalisés à vos clients, vous devez analyser les achats précédents de clients sur votre site web. Cette section explique comment ces données sont ingérées dans Platform à Adobe Analytics et comment ces données sont transformées en un jeu de données de fonctionnalités à utiliser par votre modèle d'apprentissage automatique.

Exploration des données et compréhension des schémas

  1. Connectez-vous à Adobe Experience Platform et cliquez sur Jeux de données pour faire la liste de tous les jeux de données existants et sélectionnez le jeu de données à explorer. Dans ce cas, le jeu de données Analytics Golden Data Set postValues.
  2. Cliquez sur Prévisualiser le jeu de données près du coin supérieur droit pour examiner les enregistrements d’exemples, puis cliquez sur Fermer.
  3. Cliquez sur le lien sous Schéma dans le rail de droite pour afficher le schéma pour le jeu de données, puis revenez à la page des détails du jeu de données.

Les autres jeux de données ont été préremplis avec des lots à des fins d’aperçu. Vous pouvez afficher ces jeux de données en répétant les étapes ci-dessus.

Nom du jeu de données Schéma Description
Valeurs de publication du jeu de données favori Schéma du jeu de données favori AnalyticsDonnées source de votre site web
Jeu de données d’entrée des recommandations Schéma d’entrée des recommandations Les données Analytics sont transformées en un jeu de données d’identification à l’aide d’un pipeline de fonctionnalités. Ces données sont utilisées pour former le modèle d’apprentissage automatique de recommandations de produits. itemid et userid correspondent à un produit acheté par ce client.
Jeu de données de sortie des recommandations Schéma de sortie des recommandations Le jeu de données pour lequel les résultats de notation sont stockés contient la liste des produits recommandés pour chaque client.

Création de votre modèle

Le deuxième composant du cycle de vie Data Science Workspace implique la création de Recettes et de Modèles. La recette des recommandations de produits est conçue pour générer des recommandations de produits à grande échelle en utilisant les données d’achats antérieurs et l’apprentissage automatique.

Les recettes sont la base d’un modèle puisqu’elles contiennent des algorithmes d’apprentissage automatique et une logique conçue pour résoudre des problèmes spécifiques. Plus important encore, les recettes vous permettent de démocratiser l’apprentissage automatique au sein de votre organisation, en permettant à d’autres utilisateurs d’accéder à un modèle pour des cas d’utilisation variés sans devoir coder.

Exploration de la recette des recommandations de produits

  1. Dans Adobe Experience Platform, accédez à Modèles dans la colonne de navigation de gauche, puis cliquez sur Recettes dans la partie supérieure pour vue une liste de recettes disponibles pour votre organisation.
  2. Recherchez et ouvrez la recette de recommandations fournie en cliquant sur son nom.
  3. Dans le rail de droite, cliquez sur Schéma d’entrée des recommandations pour afficher le schéma qui alimente la recette. Les champs de schéma "itemId" et "userId" correspondent à un produit acheté (interactionType) par ce client à un moment spécifique (horodatage). Suivez les mêmes étapes pour consulter le Schéma de sortie des recommandations.

Vous avez maintenant examiné les schémas d’entrée et de sortie requis par la recette des recommandations de produits. Vous pouvez maintenant passer à la section suivante pour savoir comment créer, entraîner et évaluer un modèle de recommandations de produits.

Formation et évaluation de votre modèle

Maintenant que vos données sont préparées et que la recette est prête à être utilisée, vous pouvez créer, entraîner et évaluer votre modèle d’apprentissage automatique.

Création d’un modèle

Un modèle est une instance de recette qui permet l’entraînement et l’évaluation de données à grande échelle.

  1. Dans Adobe Experience Platform, accédez à Modèles dans la colonne de navigation de gauche, puis cliquez sur Recettes en haut de la page pour afficher une liste de toutes les recettes disponibles pour votre organisation.
  2. Recherchez et ouvrez la recette de recommandations fournie en cliquant sur son nom, en entrant sur la page de présentation de la recette. Cliquez sur Créer un modèle, soit à partir du centre (s’il n’existe aucun modèle), soit en haut à droite de la page de présentation de la recette.
  3. Une liste de jeux de données d’entrée disponibles pour l’entraînement s’affiche. Sélectionnez Jeu de données d’entrée des recommandations et cliquez sur Suivant.
  4. Donnez un nom au modèle, par exemple « Modèle de recommandations de produits ». Les configurations disponibles pour le modèle sont répertoriées, contenant les paramètres des comportements de formation et de notation par défaut du modèle. Aucune modification n’est nécessaire, car ces configurations sont propres à votre organisation. Vérifiez les configurations et cliquez sur Terminer.
  5. Le modèle a maintenant été créé et la page de présentation du modèle s’affiche dans une nouvelle session d’entraînement. Une session d’entraînement est générée par défaut lors de la création d’un modèle.

Vous pouvez choisir d’attendre la fin de la session d’entraînement ou continuer à créer une session d’entraînement dans la section suivante.

Entraînement du modèle à l’aide d’hyperparamètres personnalisés

  1. Sur la page de présentation du modèle, cliquez sur Entraîner près du coin supérieur droit pour créer une session d’entraînement. Sélectionnez le même jeu de données d’entrée que celui utilisé lors de la création du modèle, puis cliquez sur Suivant.

  2. La page de configuration s’affiche. Vous pouvez ici configurer la valeur "num_recommendations" de la série de formations, également appelée Hyperparamètre. Un modèle entraîné et optimisé utilisera les hyperparamètres les plus performants en fonction des résultats de la session d’entraînement.

    Les hyperparamètres ne peuvent pas être appris. Par conséquent, ils doivent être attribués avant les sessions d’entraînement. L’ajustement d’hyperparamètres peut modifier la précision du modèle entraîné. L’optimisation d’un modèle étant un processus itératif, il peut être nécessaire de procéder à plusieurs sessions d’entraînement avant d’effectuer une évaluation satisfaisante.

    CONSEIL

    Définissez num_recommendations sur 10.

  3. Un point de données supplémentaire apparaîtra sur le graphique d’évaluation du modèle une fois la nouvelle session d’entraînement terminée, ce qui peut prendre plusieurs minutes.

Évaluation du modèle

Chaque fois qu’une session d’entraînement se termine, vous pouvez afficher les mesures d’évaluation qui en résultent pour déterminer l’efficacité du modèle.

  1. Vérifiez les mesures d’évaluation (précision et rappel) pour chaque session d’entraînement terminée en cliquant sur la session d’entraînement.
  2. Explorez les informations fournies pour chaque mesure d’évaluation. Plus ces mesures sont élevées, plus le modèle est performant.
  3. Vous pouvez voir le jeu de données, les schémas et les paramètres de configuration utilisés pour chaque session d’entraînement sur le rail droit.
  4. Revenez à la page Modèle et identifiez les sessions d’entraînement les plus performantes en observant leurs mesures d’évaluation.

Exploitation de votre modèle

La dernière étape du workflow Data Science consiste à rendre opérationnel votre modèle afin de recueillir et d’exploiter les insights de votre banque de données.

Évaluation et génération d’insights

  1. Sur la page de présentation du modèle de recommandations de produits, cliquez sur le nom de la session d’entraînement la plus performante, avec les valeurs de rappel et de précision les plus élevées.
  2. Dans la partie supérieure droite de la page des détails de la session d’entraînement, cliquez sur Évaluer.
  3. Sélectionnez le jeu de données d’entrée des recommandations comme jeu de données d’entrée de notation, qui est le même jeu de données que celui utilisé lors de la création du modèle et de l’exécution de ses sessions d’entraînement. Cliquez ensuite sur Suivant.
  4. Sélectionnez le jeu de données de sortie des recommandations comme jeu de données de sortie de notation. Les résultats de notation seront stockés dans ce jeu de données sous la forme d’un lot.
  5. Vérifiez les configurations de notation. Ces paramètres contiennent les jeux de données d’entrée et de sortie sélectionnés plus tôt, ainsi que les schémas appropriés. Cliquez sur Terminer pour lancer l’opération de notation. Cela peut prendre plusieurs minutes.

Affichage des insights évalués

Une fois l’opération de notation terminée, vous serez en mesure de prévisualiser les résultats et d’afficher les insights générés.

  1. Sur la page des opérations de notation, cliquez sur l’opération de notation terminée, puis cliquez sur Aperçu du jeu de données des résultats de la notation sur le rail de droite.
  2. Dans le tableau de prévisualisation, chaque ligne contient des recommandations de produits pour un client en particulier, respectivement libellés recommendations et userId. Puisque l’hyperparamètre num_recommendations a été défini sur 10 dans les exemples de captures d’écran, chaque ligne de recommandations peut contenir jusqu’à 10 identités de produit délimitées par un signe dièse (#).

Étapes suivantes

Bien joué, vous avez généré avec succès des recommandations de produits.

Ce didacticiel vous a présenté le flux de travail de Data Science Workspace, qui montre comment les données brutes non traitées peuvent être transformées en informations utiles par l'apprentissage automatique. Pour en savoir plus sur l'utilisation du Data Science Workspace, consultez le guide suivant sur la création du schéma de vente au détail et du jeu de données.

Sur cette page

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free