JupyterLab é uma interface de usuário baseada na Web para o Project Júpiter e está totalmente integrada ao Adobe Experience Platform. Ele fornece um ambiente de desenvolvimento interativo para que os cientistas de dados trabalhem com notebooks, códigos e dados de Júpiter.
Este documento fornece uma visão geral do JupyterLab e seus recursos, bem como instruções para executar ações comuns.
A integração com o JByterLab é acompanhada de mudanças arquitetônicas, considerações de design, extensões de notebook personalizadas, bibliotecas pré-instaladas e um tema de Adobe.
A lista a seguir descreve alguns dos recursos exclusivos do JupyterLab na plataforma:
Recurso | Descrição |
---|---|
Kernels | Os kernels fornecem notebook e outros JupyterLab front-ends com a capacidade de executar e inserir código em diferentes linguagens de programação. Experience Platform fornece kernels adicionais para suportar o desenvolvimento em PythonR, PySpark e Spark. Consulte a seção kernels para obter mais detalhes. |
Acesso aos dados | Acesse conjuntos de dados existentes diretamente de JupyterLab com suporte total para recursos de leitura e gravação. |
Platformintegração de serviços | As integrações incorporadas permitem que você utilize outros Platform serviços diretamente de JupyterLab. Uma lista completa de integrações compatíveis é fornecida na seção Integração com outros serviços da plataforma. |
Autenticação | Além do modelo de segurança incorporado do JupyterLab, todas as interações entre o aplicativo e o Experience Platform, incluindo a comunicação serviço a serviço da plataforma, são criptografadas e autenticadas por meio do Adobe Identity Management System (IMS). |
Bibliotecas de desenvolvimento | Em Experience Platform, JupyterLab fornece bibliotecas pré-instaladas para Python, R e PySpark. Consulte o apêndice para obter uma lista completa das bibliotecas suportadas. |
Controladora de biblioteca | Quando as bibliotecas pré-instaladas não atendem às suas necessidades, bibliotecas adicionais podem ser instaladas para Python e R, e são temporariamente armazenadas em container isolados para manter a integridade de Platform e manter seus dados seguros. Consulte a seção kernels para obter mais detalhes. |
As bibliotecas adicionais só estão disponíveis para a sessão em que foram instaladas. É necessário reinstalar as bibliotecas adicionais necessárias ao iniciar novas sessões.
A normalização e a interoperabilidade são conceitos-chave por trás Experience Platform. A integração de JupyterLab em Platform como um IDE incorporado permite que ele interaja com outros Platform serviços, permitindo que você utilize Platform ao seu potencial total. Os seguintes serviços Platform estão disponíveis em JupyterLab:
Algumas integrações de serviço Platform em JupyterLab estão limitadas a kernels específicos. Consulte a seção em kernels para obter mais detalhes.
As informações sobre os principais recursos de JupyterLab e as instruções sobre como executar operações comuns são fornecidas nas seções abaixo:
Em Adobe Experience Platform, selecione Notebooks na coluna de navegação esquerda. Aguarde até que JupyterLab seja totalmente inicializado.
A interface JupyterLab consiste em uma barra de menus, uma barra lateral esquerda flexível e a área de trabalho principal contendo guias de documentos e atividades.
Barra de menus
A barra de menus na parte superior da interface tem menus de nível superior que expõem ações disponíveis em JupyterLab com seus atalhos de teclado:
Barra lateral esquerda
A barra lateral esquerda contém guias clicáveis que fornecem acesso aos seguintes recursos:
Clique em uma guia para expor seus recursos, ou clique em uma guia expandida para recolher a barra lateral esquerda, como demonstrado abaixo:
Principal área de trabalho
A área de trabalho principal em JupyterLab permite que você organize documentos e outras atividades em painéis de guias que podem ser redimensionados ou subdivididos. Arraste uma guia até o centro de um painel de guias para migrar a guia. Divida um painel arrastando uma guia para a esquerda, direita, superior ou inferior do painel:
As células de código são o conteúdo principal dos notebooks. Eles contêm o código fonte no idioma do kernel associado do notebook e a saída como resultado da execução da célula de código. Uma contagem de execução é exibida à direita de cada célula de código que representa sua ordem de execução.
As ações celulares comuns estão descritas abaixo:
Adicionar uma célula: Clique no símbolo de mais (+) no menu do bloco de anotações para adicionar uma célula vazia. Novas células são colocadas sob a célula que está sendo interagida atualmente com, ou no final do notebook se nenhuma célula específica estiver em foco.
Mover uma célula: Coloque o cursor à direita da célula que deseja mover e, em seguida, clique e arraste a célula para um novo local. Além disso, mover uma célula de um notebook para outro replica a célula junto com seu conteúdo.
Executar uma célula: Clique no corpo da célula que deseja executar e clique no ícone reproduzir (▶) no menu do notebook. Um asterisco (*) é exibido no contador de execução da célula quando o kernel está processando a execução e é substituído por um número inteiro após a conclusão.
Excluir uma célula: Clique no corpo da célula que deseja excluir e clique no ícone de script.
Os kernels notebook são os mecanismos de computação específicos da linguagem para processar células de notebook. Além de Python, JupyterLab oferece suporte adicional a idiomas em R, PySpark e Spark (Scala). Quando você abre um documento notebook, o kernel associado é iniciado. Quando uma célula do notebook é executada, o kernel executa o cálculo e produz resultados que podem consumir recursos significativos da CPU e da memória. Observe que a memória alocada não é liberada até que o kernel seja desligado.
Determinados recursos e funcionalidades estão limitados a kernels específicos, conforme descrito no quadro abaixo:
Kernel | Suporte à instalação da biblioteca | Platform integrações |
---|---|---|
Python | Sim |
|
R | Sim |
|
Scala | Não |
|
Cada notebook ativo ou atividade em JupyterLab utiliza uma sessão de kernel. Todas as sessões ativas podem ser encontradas expandindo a guia Executando terminais e kernels na barra lateral esquerda. O tipo e o estado do kernel de um notebook podem ser identificados observando a parte superior direita da interface do notebook. No diagrama abaixo, o kernel associado do notebook é Python3 e seu estado atual é representado por um círculo cinza à direita. Um círculo oco implica um kernel ocioso e um círculo sólido implica um kernel ocupado.
Se o kernel estiver desligado ou inativo por um período prolongado, então Sem kernel! com um círculo sólido é mostrado. Ative um kernel clicando no status do kernel e selecionando o tipo de kernel apropriado, conforme demonstrado abaixo:
O Iniciador personalizado fornece modelos de notebook úteis para seus kernels suportados para ajudá-lo a iniciar sua tarefa, incluindo:
Modelo | Descrição |
---|---|
Em branco | Um arquivo de bloco de anotações vazio. |
Início | Um notebook pré-preenchido demonstrando a exploração de dados usando dados de amostra. |
Vendas a varejo | Um notebook pré-preenchido com a receita de vendas de varejo usando dados de amostra. |
Construtor de receita | Um modelo de bloco de notas para criar uma fórmula em JupyterLab. Ele é pré-preenchido com código e comentário que demonstra e descreve o processo de criação da receita. Consulte o tutorial notebook para fórmula para obter uma apresentação detalhada. |
Query Service | Um notebook pré-preenchido demonstrando o uso de Query Service diretamente em JupyterLab com workflows de amostra fornecidos que analisam dados em escala. |
Eventos XDM | Um notebook pré-preenchido demonstrando a exploração de dados nos dados do Evento da experiência de pós-valor, com foco nos recursos comuns em toda a estrutura de dados. |
Query XDM | Um notebook pré-preenchido demonstrando query comerciais de amostra sobre os dados do Evento Experience. |
Agregação | Um notebook pré-preenchido demonstrando workflows de amostra para agregação de grandes quantidades de dados em blocos menores e gerenciáveis. |
Geração de cluster | Um notebook pré-preenchido demonstrando o processo completo de modelagem de aprendizado de máquina usando algoritmos de cluster. |
Alguns modelos de notebook estão limitados a determinados kernels. A disponibilidade do modelo para cada kernel está mapeada na seguinte tabela:
Em branco | Início | Vendas a varejo | Construtor de receita | Query Service | Eventos XDM | Query XDM | Agregação | Geração de cluster | |
---|---|---|---|---|---|---|---|---|---|
Python | sim | sim | sim | sim | sim | sim | não | não | não |
R | sim | sim | sim | não | não | não | não | não | não |
PySpark 3 (Spark 2.4) | não | sim | não | não | não | não | sim | sim | não |
Scala | sim | sim | não | não | não | não | não | não | sim |
Para abrir um novo Iniciador, clique em Arquivo > Novo Iniciador. Como alternativa, expanda Navegador de arquivos da barra lateral esquerda e clique no símbolo de mais (+):
Em JupyterLab, selecione o ícone de engrenagem no canto superior direito para abrir Configuração do servidor do notebook. Você pode ativar a GPU e alocar a quantidade de memória necessária usando o controle deslizante. A quantidade de memória que você pode alocar depende de quanto a sua organização provisionou. Selecione Atualizar configurações para salvar.
Somente uma GPU é provisionada por organização para notebooks. Se a GPU estiver em uso, é necessário aguardar o usuário que reservou a GPU para liberá-la. Isso pode ser feito fazendo logout ou deixando a GPU em estado ocioso por quatro ou mais horas.
Para saber mais sobre cada um dos notebooks suportados e como usá-los, visite o guia do desenvolvedor de notebooks Jupyterlab data access. Este guia foca em como usar os notebooks JupyterLab para acessar seus dados, incluindo leitura, gravação e consulta de dados. O guia de acesso a dados também contém informações sobre a quantidade máxima de dados que pode ser lida por cada notebook suportado.
Biblioteca | Versão |
---|---|
notebook | 6.0.0 |
solicitações | 2,22,0 |
total | 4.0.0 |
fólio | 0,10,0 |
ipywidgets | 7.5.1. |
bokeh | 1.3.1. |
genismo | 3.7.3. |
ipyparalelo | 0,5,2 |
jq | 1,6 |
keras | 2.2.4. |
nltk | 3.2.5. |
pandas | 0,22,0 |
pandasql | 0,7,3 |
travesseiro | 6.0.0 |
scikit-image | 0,15,0 |
scikit-learn | 0,21,3 |
cifra | 1.3.0 |
sutura | 1.3.0 |
seaborna | 0.9.0 |
stats models | 0,10,1 |
elástico | 5.1.0.17 |
conspiração | 0,11,5 |
py-xgover | 0,90 |
opencv | 3.4.1. |
parque | 2.4.3. |
pirâmide | 1.0.1 |
wxpython | 4.0.6. |
colorida | 0.3.0 |
geopandas | 0.5.1 |
piranha | 2.1.0 |
forma | 1.6.4. |
rpy2 | 2,9,4 |
essenciais | 3,6 |
r-arules | 1.6_3 |
r-fpc | 2.2_3 |
r-e1071 | 1.7_2 |
r-gam | 1,16,1 |
r-gbm | 2.1.5. |
r-ggems | 4.2.0 |
r-ggvis | 0,4,4 |
r-igraph | 1.2.4.1 |
saltos de r | 3,0 |
manipular novamente | 1.0.1 |
r-rocr | 1.0_7 |
r-rmysql | 0,10,17 |
r-rodbc | 1.3_15 |
r-rsqlite | 2.1.2. |
r-rstan | 2,19,2 |
r-sqldf | 0.4_11 |
sobrevivência | 2.44_1.1 |
r-zoo | 1.8_6 |
r-stringdist | 0.9.5.2 |
r-quadprog | 1.5_7 |
r-rjson | 0,2,20 |
re-previsão | 8,7 |
r-rsolnp | 1,16 |
r-reticulado | 1,12 |
r-mlr | 2,14,0 |
r-viridis | 0.5.1 |
rondagem | 0,84 |
r-fnn | 1.1.3. |
r-lubridate | 1.7.4. |
r-randomforest | 4.6_14 |
r-tidyverse | 1.2.1. |
r-tree | 1.0_39 |
pímono | 3.8.0 |
pifleta | 0,14,1 |
boto3 | 1.9.1999 |
ipyvolume | 0,5,2 |
fast parquet | 0.3.2 |
piritão | 0,5,4 |
ipywebrtc | 0.5.0 |
jupyter_client | 5.3.1. |
wordcloud | 1.5.0 |
grafite | 2,40,1 |
piton-grafviz | 0,11,1 |
azure-armazenamento | 0,36,0 |
jupyterlab | 1.0.4. |
pandas_ml | 0.6.1 |
tensorflow-gpu | 1,14,0 |
nodejs | 12.3.0 |
zombaria | 3.0.5. |
pílula | 0.3.3 |
fonts-anacond | 1.0 |
psicopg2 | 2,8,3 |
nariz | 1.3.7 |
autovizwidget | 0,12,9 |
altair | 3.1.0 |
vega_datasets | 0.7.0 |
papelaria | 1.0.1 |
sql_mágica | 0,04 |
iso3166 | 1,0 |
nbimportador | 0.3.1 |
Biblioteca | Versão |
---|---|
solicitações | 2,18,4 |
genismo | 2.3.0 |
keras | 2,0,6 |
nltk | 3.2.4. |
pandas | 0,20,1 |
pandasql | 0,7,3 |
travesseiro | 5.3.0 |
scikit-image | 0,13,0 |
scikit-learn | 0,19,0 |
cifra | 0,19,1 |
sutura | 1.3.3 |
stats models | 0.8.0 |
elástico | 4.0.30.44 |
py-xgover | 0,60 |
opencv | 3.1.0 |
pifleta | 0.8.0 |
boto3 | 1.5.18 |
azure-armazenamento-blob | 1.4.0 |
python | 3,6,7 |
mkl-rt | 11,1 |