JupyterLab ist eine Web-basierte Benutzeroberfläche für Project Jupyter und ist eng in Adobe Experience Platform integriert. Es bietet eine interaktive Entwicklungsumgebung, in der Datenwissenschaftler mit Jupyter Notebooks, Code und Daten arbeiten können.
Dieses Dokument bietet einen Überblick über JupyterLab und deren Funktionen sowie Anweisungen zum Ausführen allgemeiner Aktionen.
Die JupyterLab-Integration mit Experience Platform wird von Architekturänderungen, Designüberlegungen, benutzerdefinierten Notebook-Erweiterungen, vorinstallierten Bibliotheken und einer Oberfläche im Stil von Adobe begleitet.
In der folgenden Liste werden einige der Funktionen vorgestellt, die bei JupyterLab auf Platform einzigartig sind:
Funktion | Beschreibung |
---|---|
Kernels | Kernels bieten Notebook und andere JupyterLab Front-Ends ermöglichen die Ausführung und Überprüfung von Code in verschiedenen Programmiersprachen. Experience Platform bietet zusätzliche Kernels zur Unterstützung der Entwicklung in Python, R, PySpark und Spark. Weiterführende Informationen finden Sie im Abschnitt Kernels. |
Datenzugriff | Auf vorhandene Datensätze direkt in zugreifen JupyterLab mit voller Unterstützung für Lese- und Schreibfunktionen. |
PlatformDienstintegration | Integrierte Integrationen ermöglichen die Nutzung anderer Platform direkt von innerhalb JupyterLab. Eine vollständige Liste der unterstützten Integrationen finden Sie im Abschnitt zur Integration mit anderen Platform-Diensten. |
Authentifizierung | Zusätzlich zum nativen Sicherheitsmodell von JupyterLab wird jede Interaktion zwischen Ihrer Anwendung und Experience Platform, einschließlich der Kommunikation zwischen Platform-Diensten, über das Adobe Identity Management System (IMS) verschlüsselt und authentifiziert. |
Entwicklungsbibliotheken | In Experience Platform, JupyterLab stellt vorinstallierte Bibliotheken für Python, R und PySpark. Eine vollständige Liste der unterstützten Bibliotheken finden Sie im Anhang. |
Bibliotheks-Controller | Wenn die vorinstallierten Bibliotheken Ihren Anforderungen nicht entsprechen, können zusätzliche Bibliotheken für Python und R installiert und vorübergehend in isolierten Behältern gespeichert werden, um die Integrität von Platform und halten Sie Ihre Daten sicher. Weiterführende Informationen finden Sie im Abschnitt Kernels. |
Zusätzliche Bibliotheken sind nur für die Sitzung verfügbar, in der sie installiert werden. Wenn Sie neue Sitzungen starten, müssen Sie alle zusätzlichen Bibliotheken, die Sie benötigen, neu installieren.
Standardisierung und Interoperabilität sind Schlüsselkonzepte von Experience Platform. Die Integration von JupyterLab on Platform als eingebettete IDE ermöglicht sie die Interaktion mit anderen Platform Dienste, mit denen Sie Platform das gesamte Potenzial ausschöpfen. Folgendes Platform Dienste sind verfügbar unter JupyterLab:
Einige Platform Service-Integrationen in JupyterLab sind auf bestimmte Kernels beschränkt. Weiterführende Informationen finden Sie im Abschnitt Kernels.
Informationen zu den wichtigsten Funktionen von JupyterLab Anweisungen zur Durchführung allgemeiner Vorgänge finden Sie in den folgenden Abschnitten:
In Adobe Experience Platformauswählen Notebooks in der linken Navigationsspalte. Lassen Sie etwas Zeit für JupyterLab , um vollständig zu initialisieren.
Die JupyterLab -Benutzeroberfläche besteht aus einer Menüleiste, einer reduzierbaren linken Seitenleiste und dem Hauptarbeitsbereich mit Registerkarten für Dokumente und Aktivitäten.
Menüleiste
Die Menüleiste am oberen Rand der Benutzeroberfläche verfügt über Menüs der obersten Ebene, die Aktionen verfügbar machen in JupyterLab mit ihren Tastaturbefehlen:
Linke Seitenleiste
Die linke Seitenleiste enthält anklickbare Registerkarten, die Zugriff auf die folgenden Funktionen bieten:
Wählen Sie eine Registerkarte aus, um deren Funktionen anzuzeigen, oder wählen Sie auf einer erweiterten Registerkarte aus, um die linke Seitenleiste wie unten dargestellt zu reduzieren:
Hauptarbeitsbereich
Hauptarbeitsbereich in JupyterLab ermöglicht es Ihnen, Dokumente und andere Aktivitäten in Registerkarten-Bereiche anzuordnen, die in der Größe angepasst oder unterteilt werden können. Ziehen Sie eine Registerkarte in die Mitte eines Registerkarten-Panels, um die Registerkarte zu verschieben. Unterteilen Sie ein Panel durch Ziehen einer Registerkarte nach links, rechts, oben oder unten im Panel:
In JupyterLab Wählen Sie das Zahnradsymbol in der oberen rechten Ecke aus, um es zu öffnen. Notebook-Serverkonfiguration. Mit dem Schieberegler können Sie GPU aktivieren und die benötigte Speichermenge zuweisen. Wie viel Arbeitsspeicher Sie zuweisen können, hängt davon ab, wie viel Arbeitsspeicher Ihr Unternehmen bereitgestellt hat. Auswählen Konfigurationen aktualisieren speichern.
Pro Unternehmen wird nur eine GPU für Notebooks bereitgestellt. Wenn die GPU verwendet wird, müssen Sie warten, bis der Benutzer, der die GPU derzeit reserviert hat, sie veröffentlicht. Dazu können Sie sich abmelden oder die GPU vier oder mehr Stunden lang im Leerlauf belassen.
In JupyterLabkönnen Sie Ihre Sitzung beenden, um die Verwendung weiterer Ressourcen zu verhindern. Wählen Sie zunächst Leistungssymbol , wählen Sie Herunterfahren aus dem Popup, das Ihre Sitzung zu beenden scheint. Notebook-Sitzungen enden nach 12 Stunden ohne Aktivität automatisch.
Neustart JupyterLab, wählen Sie die Symbol Neustart direkt links neben dem Power-Symbol befindet, und wählen Sie Neu starten aus dem Popup, das angezeigt wird.
Code-Zellen sind der Hauptinhalt von Notebooks. Sie enthalten Quell-Code in der Sprache des Kernels vom Notebook und die Ausgabe als Ergebnis der Ausführung der Code-Zelle. Rechts neben jeder Code-Zelle, die die Ausführungsreihenfolge darstellt, wird ein Ausführungszähler angezeigt.
Häufige Zellaktionen werden nachfolgend beschrieben:
Zelle hinzufügen: Klicken Sie im Notebook-Menü auf das Pluszeichen (+), um eine leere Zelle hinzuzufügen. Neue Zellen werden unter der Zelle platziert, mit der derzeit interagiert wird, oder am Ende des Notebooks, wenn keine bestimmte Zelle im Fokus ist.
Zelle verschieben: Platzieren Sie den Cursor rechts neben der Zelle, die Sie verschieben möchten, und ziehen Sie die Zelle dann an eine neue Position. Wenn Sie eine Zelle von einem Notebook in ein anderes verschieben, wird die Zelle zusammen mit ihrem Inhalt repliziert.
Zelle ausführen: Klicken Sie auf den Text der Zelle, die Sie ausführen möchten, und klicken Sie dann auf das Wiedergabesymbol (▶) im Notebook-Menü. Im Ausführungszähler der Zelle wird ein Sternchen (*) angezeigt, wenn der Kernel die Ausführung verarbeitet, und nach Abschluss durch eine Ganzzahl ersetzt.
Zelle löschen: Klicken Sie auf den Text der Zelle, die Sie löschen möchten, und klicken Sie dann auf das Symbol Schere.
Notebook-Kernel sind sprachspezifische Rechen-Engines zur Verarbeitung von Notebook-Zellen. Zusätzlich zu Python, JupyterLab bietet zusätzliche Sprachunterstützung in R, PySpark und Spark (Scala). Wenn Sie ein Notebook-Dokument öffnen, wird der zugehörige Kernel gestartet. Wenn eine Notebook-Zelle ausgeführt wird, führt der Kernel die Berechnung durch und erzeugt Ergebnisse, die erhebliche CPU- und Arbeitsspeicherressourcen beanspruchen können. Beachten Sie, dass zugewiesener Speicher erst freigegeben wird, wenn der Kernel heruntergefahren wird.
Bestimmte Funktionen und Funktionen sind auf bestimmte Kernels beschränkt, wie in der folgenden Tabelle beschrieben:
Kernel | Installationsunterstützung für Bibliotheken | Platform Integrationen |
---|---|---|
Python | Ja |
|
R | Ja |
|
Scala | Nein |
|
Jedes aktive Notebook oder jede aktive Aktivität in JupyterLab verwendet eine Kernel-Sitzung. Alle aktiven Sitzungen finden Sie, indem Sie auf der linken Seitenleiste die Registerkarte Laufende Terminals und Kernel erweitern. Typ und Zustand des Kernels eines Notebooks finden Sie in der oberen rechten Ecke der Notebook-Oberfläche. In der Abbildung unten ist der zugehörige Kernel des Notebooks Python3 und der aktuelle Status wird durch einen grauen Kreis rechts dargestellt. Ein leerer Kreis impliziert einen Kernel im Leerlauf, während ein ausgefüllter Kreis einen aktiven Kernel darstellt.
Wenn der Kernel heruntergefahren oder für einen längeren Zeitraum inaktiv ist, dann Kein Kernel! mit einem ausgefüllten Kreis angezeigt. Aktivieren Sie einen Kernel, indem Sie auf den Kernel-Status klicken und den entsprechenden Kernel-Typ auswählen, wie unten gezeigt:
Der angepasste Starter bietet nützliche Notebook-Vorlagen für die unterstützten Kernels, die Ihnen helfen, mit Ihrer Aufgabe zu beginnen, darunter:
Vorlage | Beschreibung |
---|---|
Leer | Eine leere Notebook-Datei. |
Starter | Ein vorausgefülltes Notebook, das die Datenerfassung anhand von Musterdaten demonstriert. |
Einzelhandelsumsätze | Ein vorausgefülltes Notebook mit Rezept für Einzelhandelsumsätze Verwendung von Beispieldaten. |
Recipe Builder | Eine Notebook-Vorlage zum Erstellen eines Rezepts in JupyterLab. Sie ist mit Code und Kommentaren vorausgefüllt, die die Erstellung von Rezepten demonstrieren und beschreiben. Eine ausführliche Vorgehensweise finden Sie im Tutorial Notebook an Rezept. |
Query Service | Ein vorausgefülltes Notebook, das die Verwendung von Query Service direkt in JupyterLab mit Beispielarbeitsabläufen, die Daten skaliert analysieren. |
ExperienceEvents | Ein vorausgefülltes Notebook, das die Datenerkundung bei Nachwertdaten von Erlebnisereignissen demonstriert und sich auf Funktionen konzentriert, die in der ganzen Datenstruktur einheitlich sind. |
XDM Queries | Ein vorausgefülltes Notebook, das geschäftliche Beispielabfragen zu Erlebnisereignisdaten veranschaulicht. |
Aggregation | Ein vorausgefülltes Notebook, das Beispiel-Workflows zur Aggregation großer Datenmengen in kleineren, besser handhabbaren Blöcken veranschaulicht. |
Clustering | Ein vorausgefülltes Notebook, das die durchgängige Modellierung für maschinellen Lernen mithilfe von Clustering-Algorithmen demonstriert. |
Einige Notebook-Vorlagen sind auf bestimmte Kernels beschränkt. Die Vorlagenverfügbarkeit für jeden Kernel wird in der folgenden Tabelle dargestellt:
Leer | Starter | Einzelhandelsumsätze | Recipe Builder | Query Service | ExperienceEvents | XDM Queries | Aggregation | Clustering | |
---|---|---|---|---|---|---|---|---|---|
Python | ja | ja | ja | ja | ja | ja | nein | nein | nein |
R | ja | ja | ja | nein | nein | nein | nein | nein | nein |
PySpark 3 (Spark 2.4) | nein | ja | nein | nein | nein | nein | ja | ja | nein |
Scala | ja | ja | nein | nein | nein | nein | nein | nein | ja |
Um einen neuen Starter zu öffnen, klicken Sie auf Datei > Neuer Starter. Alternativ können Sie den Datei-Browser in der linken Seitenleiste erweitern und auf das Pluszeichen (+) klicken:
Weitere Informationen zu den einzelnen unterstützten Notebooks und deren Verwendung finden Sie unter Datenzugriff auf Jupyterlab Notebooks Entwicklerhandbuch. In diesem Handbuch wird beschrieben, wie Sie mit JupyterLab-Notebooks auf Ihre Daten zugreifen können, einschließlich Lesen, Schreiben und Abfragen von Daten. Das Handbuch zum Datenzugriff enthält außerdem Informationen zur maximalen Datenmenge, die von jedem unterstützten Notebook gelesen werden kann.
Für eine Liste der unterstützten Pakete in Python, R und PySpark kopieren und einfügen !conda list
in eine neue Zelle ein und führen Sie dann die Zelle aus. Eine Liste der unterstützten Pakete wird in alphabetischer Reihenfolge angezeigt.
Darüber hinaus werden die folgenden Abhängigkeiten verwendet, aber nicht aufgelistet: