JupyterLab è un’interfaccia utente basata su web per Jupyter progetto ed è strettamente integrato con Adobe Experience Platform. Fornisce un ambiente di sviluppo interattivo per consentire ai data scientist di lavorare con Jupyter Notebooks, codice e dati.
Questo documento fornisce una panoramica di JupyterLab e le relative funzioni, nonché le istruzioni per eseguire azioni comuni.
L'integrazione di Experience Platform con JupyterLab è accompagnata da modifiche architetturali, considerazioni di progettazione, estensioni per notebook personalizzate, librerie preinstallate e un'interfaccia a tema Adobe.
L’elenco seguente illustra alcune delle funzioni esclusive di JupyterLab su Platform:
Funzione | Descrizione |
---|---|
Kernel | I kernel forniscono notebook e altro JupyterLab front-end per la possibilità di eseguire e introdurre il codice in diversi linguaggi di programmazione. Experience Platform fornisce kernel aggiuntivi per supportare lo sviluppo in Python, R, PySpark e Spark. Consulta la kernel per ulteriori dettagli. |
Accesso ai dati | Accedere ai set di dati esistenti direttamente da JupyterLab con supporto completo per le funzionalità di lettura e scrittura. |
Platformintegrazione dei servizi | Le integrazioni integrate consentono di utilizzare altri Platform servizi direttamente dall’interno di JupyterLab. Un elenco completo delle integrazioni supportate è disponibile nella sezione su Integrazione con altri servizi Platform. |
Autenticazione | Oltre a Modello di sicurezza integrato di JupyterLab, ogni interazione tra l’applicazione e l’Experience Platform, inclusa la comunicazione tra servizi e piattaforme, viene crittografata e autenticata tramite Adobe Identity Management System (IMS). |
Librerie di Sviluppo | In entrata Experience Platform, JupyterLab fornisce librerie preinstallate per Python, R e PySpark. Consulta la appendice per un elenco completo delle librerie supportate. |
Controller libreria | Quando le librerie preinstallate non sono sufficienti per le tue esigenze, è possibile installare librerie aggiuntive per Python e R, che vengono temporaneamente archiviate in contenitori isolati per mantenere l’integrità di Platform e mantenere i dati al sicuro. Consulta la kernel per ulteriori dettagli. |
Le librerie aggiuntive sono disponibili solo per la sessione in cui sono state installate. È necessario reinstallare tutte le librerie aggiuntive necessarie all'avvio di nuove sessioni.
La standardizzazione e l'interoperabilità sono concetti chiave alla base di Experience Platform. L'integrazione di JupyterLab il Platform come IDE incorporato consente di interagire con altri Platform servizi, che consentono di utilizzare Platform al suo pieno potenziale. I seguenti elementi Platform I servizi sono disponibili in JupyterLab:
Alcuni Platform integrazioni di servizi su JupyterLab sono limitati a kernel specifici. Consulta la sezione su kernel per ulteriori dettagli.
Informazioni sulle caratteristiche principali di JupyterLab e le istruzioni per l’esecuzione di operazioni comuni sono fornite nelle sezioni seguenti:
In entrata Adobe Experience Platform, seleziona Notebook dalla colonna di navigazione a sinistra. Dedica un po' di tempo a JupyterLab per inizializzare completamente.
Il JupyterLab L'interfaccia è costituita da una barra dei menu, da una barra laterale a sinistra comprimibile e dall'area di lavoro principale contenente schede di documenti e attività.
Barra dei menu
La barra dei menu nella parte superiore dell’interfaccia dispone di menu di livello superiore che espongono le azioni disponibili in JupyterLab con le relative scelte rapide da tastiera:
Barra laterale a sinistra
La barra laterale a sinistra contiene schede selezionabili che consentono di accedere alle seguenti funzioni:
Seleziona una scheda per esporne le funzioni o fai clic su una scheda espansa per comprimere la barra laterale a sinistra, come illustrato di seguito:
Area di lavoro principale
L'area di lavoro principale in JupyterLab consente di disporre documenti e altre attività in pannelli di schede che possono essere ridimensionati o suddivisi. Trascinare una scheda al centro di un pannello di tabulazione per migrare la scheda. Dividi un pannello trascinando una scheda a sinistra, a destra, in alto o in basso nel pannello:
In entrata JupyterLab seleziona l’icona ingranaggio nell’angolo in alto a destra per aprire Configurazione del server notebook. È possibile attivare la GPU e allocare la quantità di memoria necessaria utilizzando il dispositivo di scorrimento. La quantità di memoria che è possibile allocare dipende da quanto è stato eseguito il provisioning dell’organizzazione. Seleziona Aggiorna configurazioni per salvare.
Per i notebook viene eseguito il provisioning di una sola GPU per organizzazione. Se la GPU è in uso, è necessario attendere che l'utente che ha prenotato la GPU la rilasci. Questa operazione può essere eseguita disconnettendosi o lasciando la GPU inattiva per quattro o più ore.
In entrata JupyterLab, puoi terminare la sessione per impedire l’utilizzo di ulteriori risorse. Per iniziare, seleziona la icona di alimentazione , quindi seleziona Arresta dal popover che sembra terminare la sessione. Le sessioni del notebook terminano automaticamente dopo 12 ore di assenza di attività.
Per riavviare JupyterLab, seleziona la icona Riavvia posizionato direttamente a sinistra dell'icona di alimentazione, quindi selezionare Riavvia dal popover visualizzato.
Le celle di codice sono il contenuto principale dei notebook. Contengono codice sorgente nel linguaggio del kernel associato al blocco appunti e l'output risultante dall'esecuzione della cella del codice. A destra di ogni cella di codice che rappresenta l'ordine di esecuzione viene visualizzato un conteggio di esecuzione.
Le azioni comuni delle celle sono descritte di seguito:
Aggiungi una cella: Fare clic sul simbolo più (+) dal menu del blocco appunti per aggiungere una cella vuota. Le nuove celle vengono posizionate sotto la cella con cui si sta interagendo o alla fine del blocco appunti se non è attiva alcuna cella particolare.
Spostare una cella: Posizionare il cursore a destra della cella che si desidera spostare, quindi fare clic e trascinare la cella in una nuova posizione. Inoltre, se si sposta una cella da un blocco appunti a un altro, la cella viene replicata insieme al relativo contenuto.
Eseguire una cella: Fare clic sul corpo della cella che si desidera eseguire, quindi fare clic sul pulsante play icona (▶) dal menu del notebook. Un asterisco (*) viene visualizzato nel contatore di esecuzione della cella quando il kernel sta elaborando l'esecuzione e viene sostituito con un numero intero al termine.
Elimina cella: Fare clic sul corpo della cella che si desidera eliminare e quindi fare clic sul pulsante forbice icona.
I kernel per notebook sono i motori di elaborazione specifici per il linguaggio per l'elaborazione di celle per notebook. Oltre a Python, JupyterLab fornisce supporto linguistico aggiuntivo in R, PySpark e Spark (Scala). Quando si apre un documento blocco appunti, viene avviato il kernel associato. Quando viene eseguita una cella del notebook, il kernel esegue il calcolo e produce risultati che possono richiedere notevoli risorse di CPU e memoria. Si noti che la memoria allocata non viene liberata fino alla chiusura del kernel.
Alcune caratteristiche e funzionalità sono limitate a determinati kernel come descritto nella tabella seguente:
Kernel | Supporto per l'installazione della libreria | Platform integrazioni |
---|---|---|
Python | Sì |
|
R | Sì |
|
Scala | No |
|
Ogni blocco appunti o attività attiva JupyterLab utilizza una sessione kernel. Per trovare tutte le sessioni attive, espandi la sezione Terminali e kernel in funzione dalla barra laterale a sinistra. Il tipo e lo stato del kernel di un notebook possono essere identificati osservando la parte superiore destra dell'interfaccia del notebook. Nel diagramma seguente, il kernel associato al notebook è Python3 e il suo stato attuale è rappresentato da un cerchio grigio a destra. Un cerchio cavo implica un kernel inattivo e un cerchio solido implica un kernel occupato.
Se il kernel è spento o inattivo per un periodo prolungato, Nessun kernel. viene visualizzato con un cerchio continuo. Attivate un kernel facendo clic sullo stato del kernel e selezionando il tipo di kernel appropriato come mostrato di seguito:
Il personalizzato Modulo di avvio fornisce utili modelli di notebook per i kernel supportati, utili per avviare l'attività, tra cui:
Modello | Descrizione |
---|---|
Vuoto | Un file del blocco appunti vuoto. |
Starter | Un notebook precompilato che illustra l’esplorazione dei dati utilizzando dati di esempio. |
Vendite al dettaglio | Un notebook pre-riempito con ricetta di vendita al dettaglio utilizzando dati di esempio. |
Generatore di ricette | Un modello di blocco appunti per la creazione di una ricetta in JupyterLab. È precompilata con codice e commento che illustra e descrive il processo di creazione della ricetta. Consulta la sezione tutorial da notebook a ricetta per una procedura dettagliata. |
Query Service | Un notebook preriempito che illustra l'utilizzo di Query Service direttamente in JupyterLab con flussi di lavoro di esempio forniti che analizzano i dati su larga scala. |
Eventi XDM | Un blocco appunti precompilato che illustra l’esplorazione dei dati sui dati post-valore di Experience Event, concentrandosi sulle funzioni comuni all’intera struttura di dati. |
Query XDM | Un blocco appunti precompilato che illustra query di business di esempio sui dati di Experience Event. |
Aggregazione | Un notebook precompilato che illustra flussi di lavoro di esempio per aggregare grandi quantità di dati in blocchi più piccoli e gestibili. |
Clustering | Un notebook precompilato che illustra il processo di modellazione dell’apprendimento automatico end-to-end tramite algoritmi di clustering. |
Alcuni modelli di notebook sono limitati a determinati kernel. La disponibilità del modello per ciascun kernel è mappata nella tabella seguente:
Vuoto | Starter | Vendite al dettaglio | Generatore di ricette | Query Service | Eventi XDM | Query XDM | Aggregazione | Clustering | |
---|---|---|---|---|---|---|---|---|---|
Python | sì | sì | sì | sì | sì | sì | no | no | no |
R | sì | sì | sì | no | no | no | no | no | no |
PySpark 3 (Spark 2.4) | no | sì | no | no | no | no | sì | sì | no |
Scala | sì | sì | no | no | no | no | no | no | sì |
Per aprire un nuovo Modulo di avvio, fai clic su File > Nuovo modulo di avvio. In alternativa, espandere Browser file dalla barra laterale sinistra e fare clic sul simbolo più (+):
Per ulteriori informazioni su ciascuno dei notebook supportati e su come utilizzarli, visitare il Accesso ai dati dei notebook Jupyterlab guida per gli sviluppatori. Questa guida illustra come utilizzare i notebook JupyterLab per accedere ai dati, incluse le operazioni di lettura, scrittura e query. La guida all'accesso ai dati contiene inoltre informazioni sulla quantità massima di dati che può essere letta da ogni blocco appunti supportato.
Per un elenco dei pacchetti supportati in Python, R e PySpark, copia e incolla !conda list
in una nuova cella, quindi eseguirla. Un elenco di pacchetti supportati viene compilato in ordine alfabetico.
Inoltre, vengono utilizzate le dipendenze seguenti, ma non elencate: