JupyterLab Panoramica dell’interfaccia utente

NOTE
Data Science Workspace non è più disponibile per l’acquisto.
Questa documentazione è destinata ai clienti esistenti con precedenti diritti a Data Science Area di lavoro.

JupyterLab è un'interfaccia utente basata sul web per Project Jupyter ed è strettamente integrata in Adobe Experience Platform. Fornisce un ambiente di sviluppo interattivo per consentire ai data scientist di lavorare con Jupyter Notebooks, codice e dati.

In questo documento viene fornita una panoramica delle JupyterLab relative funzionalità, nonché istruzioni per eseguire azioni comuni.

JupyterLab su Experience Platform

L'integrazione di JupyterLab di Experience Platform è accompagnata da modifiche architetturali, considerazioni di progettazione, estensioni personalizzate per notebook, librerie preinstallate e un'interfaccia a tema Adobe Systems.

L’elenco seguente illustra alcune delle funzioni esclusive di JupyterLab su Platform:

Funzione
Descrizione
Kernel
I kernel forniscono notebook e altri JupyterLab front-end la capacità di eseguire e introspezione codice in diversi linguaggi di programmazione. Experience Platform fornisce kernel aggiuntivi per supportare lo sviluppo in Python, R, PySpark e Spark. Vedi la sezione kernel per maggiori dettagli.
Data accesso
Accedi ai set di dati esistenti direttamente dall'interno JupyterLab con il supporto completo per le funzionalità di lettura e scrittura.
PlatformIntegrazione dei servizi
Le integrazioni incorporate consentono di utilizzare altri servizi Platform direttamente da JupyterLab. Un elenco completo delle integrazioni supportate è fornito nella sezione relativa all'integrazione di con altri servizi di Platform.
Autenticazione
Oltre al modello di sicurezza integrato di JupyterLab, ogni interazione tra il applicazione e il Experience Platform, inclusa Platform comunicazione da servizio a servizio, viene crittografata e autenticata tramite l'IMSAdobe Identity Management System.
librerie di sviluppo
In Experience Platform, JupyterLab fornisce librerie preinstallati per Python, R e PySpark. Vedere l'appendice 🔗 per un elenco completo dei librerie supportati.
Controller libreria
Quando le librerie preinstallate non sono sufficienti per le tue esigenze, è possibile installare librerie aggiuntive per Python e R e archiviarle temporaneamente in contenitori isolati per mantenere l'integrità di Platform e proteggere i tuoi dati. Vedi la sezione kernel per maggiori dettagli.
NOTE
I librerie aggiuntivi sono disponibili solo per la sessione in cui sono stati installati. È necessario reinstallare eventuali librerie aggiuntivi necessari all'avvio di nuove sessioni.

Integrazione con altri Platform servizi service-integration

Standardizzazione e interoperabilità sono concetti chiave alla base di Experience Platform. L'integrazione di JupyterLab in Platform come IDE incorporato consente di interagire con altri servizi Platform, consentendo di utilizzare Platform al massimo delle potenzialità. I seguenti servizi Platform sono disponibili in JupyterLab:

  • Catalog Service: Accedi ed esplora i set di dati con funzionalità di lettura e scrittura.
  • Query Service: Accedere ed esplorare i set di dati utilizzando SQL, riducendo i costi comuni di accesso ai dati quando si gestiscono grandi quantità di dati.
  • Sensei ML Framework: sviluppo di modelli con la possibilità di addestrare e valutare i dati, nonché creazione di formule con un solo clic.
  • Experience Data Model (XDM): La standardizzazione e l'interoperabilità sono concetti chiave di Adobe Experience Platform. Experience Data Model (XDM), guidato da un Adobe, è un tentativo di standardizzare i dati sull'esperienza del cliente e definire schemi per la gestione della customer experience.
NOTE
Alcune integrazioni del servizio Platform in JupyterLab sono limitate a kernel specifici. Per ulteriori informazioni, consulta la sezione su kernel.

Funzioni principali e operazioni comuni

Le informazioni sulle caratteristiche chiave di JupyterLab e le istruzioni sull'esecuzione di operazioni comuni sono fornite nelle sezioni seguenti:

Accesso JupyterLab access-jupyterlab

In Adobe Experience Platform, seleziona Blocchi appunti dalla colonna di navigazione a sinistra. Attendere il completamento dell'inizializzazione di JupyterLab.

Interfaccia JupyterLab jupyterlab-interface

L'interfaccia JupyterLab è costituita da una barra dei menu, una barra laterale a sinistra comprimibile e l'area di lavoro principale contenente schede di documenti e attività.

Barra dei menu

La barra dei menu nella parte superiore dell'interfaccia include menu di primo livello che espongono le azioni disponibili in JupyterLab con le relative scelte rapide da tastiera:

  • File: azioni relative a file e directory
  • Modifica: azioni relative alla modifica di documenti e altre attività
  • Visualizzazione: azioni che modificano l'aspetto di JupyterLab
  • Esegui: azioni per l'esecuzione del codice in attività diverse, ad esempio blocchi appunti e console di codice
  • Kernel: azioni per la gestione dei kernel
  • Tabulazioni: un elenco di documenti e attività aperti
  • Impostazioni: impostazioni comuni e impostazioni avanzate editor
  • Guida: Un elenco di collegamenti alla guida del JupyterLab kernel

Barra laterale sinistra

La barra laterale sinistra contiene cliccabile schede che forniscono accesso alle seguenti funzioni:

  • Browser file: un elenco di documenti e directory dei blocchi appunti salvati
  • Data Explorer: Sfoglia, accesso ed esplorare set di dati e schemi
  • Kernel e terminali in esecuzione: un elenco di sessioni attive del kernel e del terminale con la possibilità di terminare
  • Comandi: un elenco di comandi utili
  • Ispettore celle: un editor di cella che fornisce accesso agli strumenti e metadati utile per impostare un blocco appunti a scopo di presentazione
  • schede: un elenco di schede aperte

Seleziona un scheda per esporne le feature oppure fai clic su un scheda espanso per comprimere la barra laterale sinistra, come illustrato di seguito:

Area di lavoro principale

L'area di lavoro principale consente JupyterLab di organizzare documenti e altre attività in pannelli di schede che possono essere ridimensionati o suddivisi. Trascinate un scheda al centro di un pannello scheda per eseguire la migrazione della scheda. Dividere un pannello trascinando un scheda a sinistra, a destra, in alto o in basso del pannello:

Configurazione GPU e server di memoria in Python/R

In JupyterLab selezionare l'icona a forma di ingranaggio nell'angolo superiore destro per aprire la configurazione del server Notebook. È possibile attivare la GPU e allocare la quantità di memoria necessaria utilizzando il cursore. La quantità di memoria che è possibile allocare dipende dalla quantità di provisioning dell'organizzazione. Seleziona Aggiorna configurazioni per salvare.

NOTE
Viene eseguito il provisioning di una sola GPU per organizzazione per i notebook. Se la GPU è in uso, è necessario attendere che l'utente che ha prenotato la GPU la rilasci. Questa operazione può essere eseguita disconnettendosi o lasciando la GPU inattiva per quattro o più ore.

Termina e riavvia JupyterLab

In JupyterLab, puoi terminare la sessione per impedire l'utilizzo di ulteriori risorse. Inizia selezionando l'icona di accensione dell'icona di accensione, quindi seleziona ​​ Spegni ​​ dal popover che sembra terminare la sessione. Le sessioni del blocco appunti terminano automaticamente dopo 12 ore di inattività.

Per riavviare JupyterLab, seleziona l'icona di riavvio dellicona di riavvio situata direttamente a sinistra dell'icona di accensione, quindi seleziona Riavvia dal popover visualizzato.

Terminare JupyterLab

Code celle code-cells

Code celle sono la contenuto principale dei quaderni. Contengono il codice sorgente nel linguaggio del kernel associato del notebook e l'output come risultato dell'esecuzione della cella di codice. A destra di ogni cella di codice che rappresenta l'ordine di esecuzione viene visualizzato un conteggio di esecuzione.

Le azioni comuni delle celle sono descritte di seguito:

  • Aggiungere una cella: fare clic sul simbolo più (+) dal menu del blocco appunti per aggiungere una cella vuota. Nuovo celle vengono posizionate sotto la cella con cui si sta interagendo o alla fine del quaderno se non è presente alcuna cella particolare in concentrarsi.

  • Spostare una cella: posiziona il cursore a destra della cella da spostare, quindi fai clic e trascina la cella in una nuova posizione. Inoltre, lo spostamento di una cella da un blocco appunti a un altro replica la cella insieme al relativo contenuto.

  • Eseguire una cella: fare clic sul corpo della cella che si desidera eseguire, quindi fare clic sull'icona di riproduzione () dal menu del blocco appunti. Un asterisco (*) viene visualizzato nel contatore di esecuzione della cella durante l'elaborazione dell'esecuzione e viene sostituito con un numero intero al termine.

  • Elimina una cella: fai clic sul corpo della cella che desideri eliminare, quindi fai clic sull'icona a forma di forbice .

Kernel kernels

I kernel per notebook sono i motori di elaborazione specifici per il linguaggio per l'elaborazione di celle per notebook. Oltre a Python, JupyterLab fornisce supporto linguistico aggiuntivo in R, PySpark e Spark (Scala). Quando si apre un documento blocco appunti, viene avviato il kernel associato. Quando viene eseguita una cella del notebook, il kernel esegue il calcolo e produce risultati che possono richiedere notevoli risorse di CPU e memoria. Si noti che la memoria allocata non viene liberata fino alla chiusura del kernel.

Alcune caratteristiche e funzionalità sono limitate a particolari kernel come descritto nella tabella seguente:

Kernel
Supporto per l'installazione della libreria
Platform Integrazioni
Python
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R
  • Sensei ML Framework
  • Catalog Service
Scala
No
  • Sensei ML Framework
  • Catalog Service

Sessioni kernel kernel-sessions

Ogni notebook o attività attiva utilizza JupyterLab una sessione del kernel. Per trovare tutte le sessioni attive, espandi la scheda Terminali e kernel in esecuzione dalla barra laterale a sinistra. Il tipo e lo stato del kernel di un notebook possono essere identificati osservando la parte superiore destra dell'interfaccia del notebook. Nel diagramma seguente, il kernel associato al blocco appunti è Python3 e il suo stato corrente è rappresentato da un cerchio grigio a destra. Un cerchio cavo implica un kernel inattivo e un cerchio solido implica un kernel occupato.

Se il kernel viene arrestato o inattivo per un periodo prolungato, Nessun kernel!Viene visualizzato con un cerchio continuo. Attivate un kernel facendo clic sullo stato del kernel e selezionando il tipo di kernel appropriato come mostrato di seguito:

Modulo di avvio launcher

Il modulo di avvio personalizzato fornisce utili modelli di blocco appunti per i kernel supportati, utili per avviare l'attività, tra cui:

Modello
Descrizione
Vuoto
Un file del blocco appunti vuoto.
Starter
Un notebook precompilato che illustra l'esplorazione dei dati utilizzando dati di esempio.
Vendite al dettaglio
Un quaderno precompilato con la ricetta🔗 di vendita al dettaglio utilizzando dati di esempio.
Generatore di ricette
Modello di blocco appunti per la creazione di una composizione in JupyterLab. È precompilata con codice e commento che illustra e descrive il processo di creazione della ricetta. Fare riferimento al blocco appunti per l'esercitazione 🔗 delle ricette per una procedura dettagliata
Query Service
Un notebook precompilato che illustra l'utilizzo di flussi di Query Service lavoro di esempio forniti direttamente in JupyterLab dotazione, che analizza i dati su larga scala.
Eventi XDM
Un notebook precompilato che illustra l'esplorazione dei dati sui dati postvalue dell'evento dell'esperienza, concentrandosi sulle funzionalità comuni a tutta la struttura dei dati.
Query XDM
Un blocco appunti precompilato che illustra query aziendali di esempio sui dati degli eventi esperienza.
Aggregazione
Un notebook precompilato che illustra i flussi di lavoro di esempio per aggregato grandi quantità di dati in blocchi più piccoli e gestibili.
Clustering
Un notebook precompilato che illustra il processo di modellazione end-to-end di Machine Learning utilizzando algoritmi di clustering.

Alcuni modelli di notebook sono limitati a determinati kernel. La disponibilità dei template per ogni kernel è mappata nella seguente tabella:

Vuoto
Avviatore
Vendite al dettaglio
Generatore di ricette
Query Service
Eventi XDM
Query XDM
Aggregazione
Clustering
Python
no
no
no
R
no
no
no
no
no
no
PySpark 3 (Spark 2.4)
no
no
no
no
no
no
Scala
no
no
no
no
no
no

Per aprire un nuovo modulo di avvio, fare clic su File > Nuovo modulo di avvio. In alternativa, espandi il File browser dalla barra laterale sinistra e fai clic sul simbolo più (+):

Passaggi successivi

Per ulteriori informazioni su ciascuno dei notebook supportati e su come usarli, visita la guida per sviluppatori di accesso dati dei notebook Jupyterlab. Questa guida è incentrata su come utilizzare i notebook JupyterLab per accesso i dati, inclusi lettura, scrittura e query sui dati. La guida accesso dati contiene inoltre informazioni sulla quantità massima di dati che possono essere letti da ogni notebook supportato.

librerie supportati supported-libraries

Per un elenco dei pacchetti supportati in Python, R e PySpark, copia e incolla !conda list in una nuova cella, quindi esegui la cella. Un elenco di pacchetti supportati viene compilato in ordine alfabetico.

esempio

Inoltre, vengono utilizzate le dipendenze seguenti, ma non elencate:

  • CUDA 11.2
  • CUDNN 8.1
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9