JupyterLab est une interface utilisateur web pour Project Jupyter et est étroitement intégré à Adobe Experience Platform. Il fournit un environnement de développement interactif pour que les chercheurs en données puissent travailler avec des ordinateurs portables, du code et des données Jupyter.
Ce document fournit un aperçu de JupyterLab et de ses fonctionnalités ainsi que des instructions pour effectuer des actions communes.
L’intégration JupyterLab d’Experience Platform est accompagnée de modifications architecturales, de considérations de conception, d’extensions de notebooks personnalisées, de bibliothèques préinstallées et d’une interface sur le thème Adobe.
La liste suivante présente quelques-unes des fonctionnalités propres à JupyterLab sur Platform :
Fonctionnalité | Description |
---|---|
Noyaux | Les noyaux fournissent un bloc-notes et d'autres JupyterLab front-ends la possibilité d'exécuter et d'introduire du code dans différents langages de programmation. Experience Platform fournit des noyaux supplémentaires pour prendre en charge le développement dans Python, R, PySpark et Spark. Pour plus d’informations, consultez la section sur les noyaux. |
Accès aux données | Accédez directement aux jeux de données existants à partir de JupyterLab avec une prise en charge complète des capacités de lecture et d'écriture. |
Platformintégration de service | Les intégrations intégrées vous permettent d'utiliser d'autres services Platform directement depuis JupyterLab. Une liste complète des intégrations prises en charge est fournie dans la section sur l’intégration avec d’autres services Platform. |
Authentification | Outre le modèle de sécurité intégré de JupyterLab, chaque interaction entre votre application et Experience Platform, y compris la communication service à service de Platform, est chiffrée et authentifiée à l’aide d’Adobe Identity Management System (IMS). |
Bibliothèques de développement | Dans Experience Platform, JupyterLab fournit des bibliothèques préinstallées pour Python, R et PySpark. Consultez l’annexe pour obtenir une liste complète des bibliothèques prises en charge. |
Contrôleur de bibliothèque | Lorsque les bibliothèques préinstallées ne répondent pas à vos besoins, d'autres bibliothèques peuvent être installées pour Python et R, et sont temporairement stockées dans des conteneurs isolés afin de préserver l'intégrité de Platform et de protéger vos données. Pour plus d’informations, consultez la section sur les noyaux. |
Les bibliothèques supplémentaires sont uniquement disponibles pour la session dans laquelle elles ont été installées. Vous devez réinstaller les bibliothèques supplémentaires nécessaires lorsque vous démarrez de nouvelles sessions.
La normalisation et l'interopérabilité sont les concepts clés qui sous-tendent Experience Platform. L'intégration de JupyterLab sur Platform en tant qu'IDE intégré lui permet d'interagir avec d'autres services Platform, ce qui vous permet d'utiliser Platform à son plein potentiel. Les services Platform suivants sont disponibles dans JupyterLab :
Certaines intégrations de service Platform sur JupyterLab sont limitées à des noyaux spécifiques. Pour plus d’informations, consultez la section sur les noyaux.
Les sections suivantes contiennent des informations sur les principales caractéristiques de JupyterLab et des instructions sur l'exécution d'opérations communes :
Dans Adobe Experience Platform, sélectionnez Ordinateurs portables dans la colonne de navigation de gauche. Patientez un certain temps pour que JupyterLab s'initialise complètement.
L'interface JupyterLab comprend une barre de menus, une barre latérale gauche réductible et la zone de travail principale contenant des onglets de documents et d'activités.
Barre de menus
La barre de menus en haut de l'interface comporte des menus de niveau supérieur qui exposent les actions disponibles dans JupyterLab avec leurs raccourcis clavier :
Barre latérale gauche
La barre latérale gauche contient des onglets cliquables qui permettent d’accéder aux fonctionnalités suivantes :
Sélectionnez un onglet pour exposer ses fonctionnalités ou sélectionnez-le sur un onglet développé pour réduire la barre latérale gauche comme illustré ci-dessous :
Espace de travail principal
La zone de travail principale de JupyterLab vous permet d'organiser les documents et autres activités en panneaux d'onglets qui peuvent être redimensionnés ou subdivisés. Faites glisser un onglet au centre d’un panneau à onglets pour le faire migrer. Divisez un panneau en faisant glisser un onglet vers la gauche, la droite, le haut ou le bas du panneau :
Dans JupyterLab, sélectionnez l'icône d'engrenage dans le coin supérieur droit pour ouvrir Configuration du serveur portable. Vous pouvez activer GPU et allouer la quantité de mémoire dont vous avez besoin en utilisant le curseur. La quantité de mémoire que vous pouvez allouer dépend de la quantité de mémoire allouée par votre organisation. Sélectionnez Mettre à jour les configurations à enregistrer.
Un seul processeur graphique est configuré par organisation pour les ordinateurs portables. Si le GPU est en cours d’utilisation, vous devez attendre que l’utilisateur qui a actuellement réservé le GPU le publie. Pour ce faire, déconnectez-vous ou quittez le GPU en état d'inactivité pendant quatre heures ou plus.
Dans JupyterLab, vous pouvez mettre fin à votre session afin d’empêcher l’utilisation de ressources supplémentaires. Début en sélectionnant icône d'alimentation , puis Arrêter dans la fenêtre contextuelle qui semble arrêter votre session. Les sessions de bloc-notes se terminent automatiquement après 12 heures sans activité.
Pour redémarrer JupyterLab, sélectionnez l'icône Redémarrer située directement à gauche de l'icône d'alimentation, puis sélectionnez Redémarrer dans la fenêtre contextuelle qui s'affiche.
Les cellules de code constituent le contenu principal des notebooks. Elles contiennent le code source dans le langage du noyau associé au notebook et la sortie résultant de l’exécution de la cellule de code. Le nombre d’exécutions est affiché à droite de chaque cellule de code qui représente son ordre d’exécution.
Les actions de cellule courantes sont décrites ci-dessous :
Ajouter une cellule : cliquez sur le symbole plus (+) dans le menu du notebook pour ajouter une cellule vide. Les nouvelles cellules sont placées sous la cellule en cours d’interaction ou à la fin du notebook si aucune cellule particulière n’est concernée.
Déplacer une cellule : placez votre curseur à droite de la cellule que vous souhaitez déplacer, puis cliquez sur la cellule et faites-la glisser vers un nouvel emplacement. De plus, le déplacement d’une cellule d’un notebook vers un autre réplique la cellule et son contenu.
Exécuter une cellule : cliquez sur le corps de la cellule que vous souhaitez exécuter, puis sur l’icône lecture (▶) dans le menu du notebook. Un astérisque (*) est affiché dans le compteur d’exécution de la cellule lorsque le noyau traite l’exécution, et est remplacé par un nombre entier une fois l’exécution terminée.
Supprimer une cellule : cliquez sur le corps de la cellule que vous souhaitez supprimer, puis sur l’icône ciseaux.
Les noyaux des notebooks sont les moteurs informatiques spécifiques au langage pour le traitement des cellules des notebooks. Outre Python, JupyterLab fournit une prise en charge linguistique supplémentaire dans R, PySpark et Spark (Scala). Lorsque vous ouvrez un document de notebook, le noyau associé est lancé. Lorsqu’une cellule de notebook est exécutée, le noyau effectue le calcul et produit des résultats qui peuvent consommer d’importantes ressources de processeur et de mémoire. Notez que la mémoire allouée n'est pas libérée tant que le noyau n'est pas fermé.
Certaines fonctionnalités sont limitées à des noyaux particuliers, comme décrit dans le tableau ci-dessous :
Noyau | Prise en charge de l’installation de la bibliothèque | Platform intégrations |
---|---|---|
Python | Oui |
|
r | Oui |
|
Scala | Non |
|
Chaque principal bloc-notes ou activité sur JupyterLab utilise une session de noyau. Vous trouverez toutes les sessions actives en développant l’onglet Noyaux et terminaux en cours d’exécution de la barre latérale gauche. Vous pouvez identifier le type et l’état du noyau d’un notebook en observant le coin supérieur droit de l’interface du notebook. Dans le diagramme ci-dessous, le noyau associé au notebook est Python 3 et son état actuel est représenté par un cercle gris à droite. Un cercle creux implique un noyau inactif et un cercle plein implique un noyau occupé.
Si le noyau est arrêté ou inactif pendant une longue période, alors Aucun noyau ! avec un cercle plein n’est affiché. Activez un noyau en cliquant sur l’état du noyau et en sélectionnant le type de noyau approprié, comme illustré ci-dessous :
Le Lanceur personnalisé fournit des modèles de notebook utiles pour les noyaux pris en charge afin de vous aider à démarrer rapidement vos tâches, notamment :
Modèle | Description |
---|---|
Vide | Un fichier de notebook vide. |
Démarrage | Un notebook prérempli présentant l’exploration des données à l’aide de données d’exemple. |
Ventes au détail | Un bloc-notes prérempli présentant la recette de vente au détail à l'aide de données d'exemple. |
Recipe Builder | Un modèle de notebook pour la création d’une recette dans JupyterLab. Il est prérempli de code et de commentaires qui présentent et décrivent le processus de création de la recette. Consultez le tutoriel notebook vers recette pour une présentation détaillée. |
Query Service | Un bloc-notes prérempli montrant l'utilisation de Query Service directement dans JupyterLab avec des exemples de workflows fournis qui analysent les données à l'échelle. |
Événements XDM | Un notebook prérempli qui présente l’exploration des données sur les données d’événement d’expérience de valeur post, en mettant l’accent sur les fonctionnalités communes à l’ensemble de la structure de données. |
Requêtes XDM | Un notebook prérempli présentant des exemples de requêtes d’entreprise sur les données d’événement d’expérience. |
Agrégation | Un notebook prérempli présentant des exemples de processus pour agréger de grandes quantités de données en petits blocs gérables. |
Mise en cluster | Un notebook prérempli présentant le processus de modélisation d’apprentissage automatique de bout en bout à l’aide d’algorithmes de mise en cluster. |
Certains modèles de notebook sont limités à des noyaux spécifiques. La disponibilité des modèles pour chaque noyau est mappée dans le tableau suivant :
Vide | Démarrage | Ventes au détail | Créateur de recettes | Service de Requête | Événements XDM | Requêtes XDM | Agrégation | Mise en cluster | |
---|---|---|---|---|---|---|---|---|---|
Python | oui | oui | oui | oui | oui | oui | non | non | non |
R | oui | oui | oui | non | non | non | non | non | non |
PySpark 3 (Spark 2.4) | non | oui | non | non | non | non | oui | oui | non |
Scala | oui | oui | non | non | non | non | non | non | oui |
Pour ouvrir un nouveau lanceur, cliquez sur Fichier > Nouveau lanceur. Vous pouvez également développer le navigateur de fichiers depuis la barre latérale gauche et cliquer sur le symbole plus (+) :
Pour en savoir plus sur chacun des blocs-notes pris en charge et comment les utiliser, consultez le Guide du développeur Accès aux données des blocs-notes Jupyterlab. Ce guide se concentre sur l'utilisation des portables JupyterLab pour accéder à vos données, y compris la lecture, l'écriture et l'interrogation de données. Le guide d'accès aux données contient également des informations sur la quantité maximale de données pouvant être lues par chaque bloc-notes pris en charge.
Pour une liste de paquets pris en charge dans Python, R et PySpark, copiez et collez !pip list --format=columns
dans une nouvelle cellule, puis exécutez la cellule. Une liste de packages pris en charge est renseignée par ordre alphabétique.