JupyterLab Visão geral da interface do usuário

JupyterLab é uma interface de usuário baseada na Web para o Project Júpiter e está totalmente integrada ao Adobe Experience Platform. Ele fornece um ambiente de desenvolvimento interativo para que os cientistas de dados trabalhem com notebooks, códigos e dados de Júpiter.

Este documento fornece uma visão geral do JupyterLab e seus recursos, bem como instruções para executar ações comuns.

JupyterLab em Experience Platform

A integração com o JByterLab é acompanhada de mudanças arquitetônicas, considerações de design, extensões de notebook personalizadas, bibliotecas pré-instaladas e um tema de Adobe.

A lista a seguir descreve alguns dos recursos exclusivos do JupyterLab na plataforma:

Recurso Descrição
Kernels Os kernels fornecem notebook e outros JupyterLab front-ends com a capacidade de executar e inserir código em diferentes linguagens de programação. Experience Platform fornece kernels adicionais para suportar o desenvolvimento em PythonR, PySpark e Spark. Consulte a seção kernels para obter mais detalhes.
Acesso aos dados Acesse conjuntos de dados existentes diretamente de JupyterLab com suporte total para recursos de leitura e gravação.
Platformintegração de serviços As integrações incorporadas permitem que você utilize outros Platform serviços diretamente de JupyterLab. Uma lista completa de integrações compatíveis é fornecida na seção Integração com outros serviços da plataforma.
Autenticação Além do modelo de segurança incorporado do JupyterLab, todas as interações entre o aplicativo e o Experience Platform, incluindo a comunicação serviço a serviço da plataforma, são criptografadas e autenticadas por meio do Adobe Identity Management System (IMS).
Bibliotecas de desenvolvimento Em Experience Platform, JupyterLab fornece bibliotecas pré-instaladas para Python, R e PySpark. Consulte o apêndice para obter uma lista completa das bibliotecas suportadas.
Controladora de biblioteca Quando as bibliotecas pré-instaladas não atendem às suas necessidades, bibliotecas adicionais podem ser instaladas para Python e R, e são temporariamente armazenadas em container isolados para manter a integridade de Platform e manter seus dados seguros. Consulte a seção kernels para obter mais detalhes.
OBSERVAÇÃO

As bibliotecas adicionais só estão disponíveis para a sessão em que foram instaladas. É necessário reinstalar as bibliotecas adicionais necessárias ao iniciar novas sessões.

Integração com outros Platform serviços

A normalização e a interoperabilidade são conceitos-chave por trás Experience Platform. A integração de JupyterLab em Platform como um IDE incorporado permite que ele interaja com outros Platform serviços, permitindo que você utilize Platform ao seu potencial total. Os seguintes serviços Platform estão disponíveis em JupyterLab:

  • Catalog Service: acesse e explore conjuntos de dados com funcionalidades de leitura e gravação.
  • Query Service: acesse e explore conjuntos de dados usando SQL, fornecendo custos indiretos de acesso mais baixos ao lidar com grandes quantidades de dados.
  • Sensei ML Framework:Desenvolvimento de modelo com a capacidade de treinar e pontuar dados, bem como criação de receita com um único clique.
  • Experience Data Model (XDM): A padronização e a interoperabilidade são conceitos-chave por trás da Adobe Experience Platform. O Experience Data Model (XDM), orientado pelo Adobe, é um esforço para padronizar os dados de experiência do cliente e definir schemas para o gerenciamento da experiência do cliente.
OBSERVAÇÃO

Algumas integrações de serviço Platform em JupyterLab estão limitadas a kernels específicos. Consulte a seção em kernels para obter mais detalhes.

Principais recursos e operações comuns

As informações sobre os principais recursos de JupyterLab e as instruções sobre como executar operações comuns são fornecidas nas seções abaixo:

Access JupyterLab

Em Adobe Experience Platform, selecione Notebooks na coluna de navegação esquerda. Aguarde até que JupyterLab seja totalmente inicializado.

JupyterLab interface

A interface JupyterLab consiste em uma barra de menus, uma barra lateral esquerda flexível e a área de trabalho principal contendo guias de documentos e atividades.

Barra de menus

A barra de menus na parte superior da interface tem menus de nível superior que expõem ações disponíveis em JupyterLab com seus atalhos de teclado:

  • Arquivo: ações relacionadas a arquivos e diretórios
  • Editar: Ações relacionadas à edição de documentos e outras atividades
  • Visualização: ações que alteram a aparência de JupyterLab
  • Executar: ações para executar código em diferentes atividades, como notebooks e consoles de código
  • Kernel: Ações para gerenciar kernels
  • Guias: Uma lista de documentos e atividades abertos
  • Configurações:Configurações comuns e um editor de configurações avançado
  • Ajuda: uma lista de links de ajuda JupyterLab e kernel

Barra lateral esquerda

A barra lateral esquerda contém guias clicáveis que fornecem acesso aos seguintes recursos:

  • Navegador de arquivos: uma lista de documentos e diretórios de notebook salvos
  • Data Explorer: navegar, acessar e explorar conjuntos de dados e schemas
  • Correndo kernels e terminais: uma lista de sessões ativas de kernel e terminal com a capacidade de encerrar
  • Comandos: uma lista de comandos úteis
  • Inspetor de célula: um editor de célula que fornece acesso a ferramentas e metadados úteis para configurar um bloco de anotações para fins de apresentação
  • guias: Uma lista de guias abertas

Clique em uma guia para expor seus recursos, ou clique em uma guia expandida para recolher a barra lateral esquerda, como demonstrado abaixo:

Principal área de trabalho

A área de trabalho principal em JupyterLab permite que você organize documentos e outras atividades em painéis de guias que podem ser redimensionados ou subdivididos. Arraste uma guia até o centro de um painel de guias para migrar a guia. Divida um painel arrastando uma guia para a esquerda, direita, superior ou inferior do painel:

Células de código

As células de código são o conteúdo principal dos notebooks. Eles contêm o código fonte no idioma do kernel associado do notebook e a saída como resultado da execução da célula de código. Uma contagem de execução é exibida à direita de cada célula de código que representa sua ordem de execução.

As ações celulares comuns estão descritas abaixo:

  • Adicionar uma célula: Clique no símbolo de mais (+) no menu do bloco de anotações para adicionar uma célula vazia. Novas células são colocadas sob a célula que está sendo interagida atualmente com, ou no final do notebook se nenhuma célula específica estiver em foco.

  • Mover uma célula: Coloque o cursor à direita da célula que deseja mover e, em seguida, clique e arraste a célula para um novo local. Além disso, mover uma célula de um notebook para outro replica a célula junto com seu conteúdo.

  • Executar uma célula: Clique no corpo da célula que deseja executar e clique no ​ícone reproduzir () no menu do notebook. Um asterisco (*) é exibido no contador de execução da célula quando o kernel está processando a execução e é substituído por um número inteiro após a conclusão.

  • Excluir uma célula: Clique no corpo da célula que deseja excluir e clique no ​ícone de script.

Kernels

Os kernels notebook são os mecanismos de computação específicos da linguagem para processar células de notebook. Além de Python, JupyterLab oferece suporte adicional a idiomas em R, PySpark e Spark (Scala). Quando você abre um documento notebook, o kernel associado é iniciado. Quando uma célula do notebook é executada, o kernel executa o cálculo e produz resultados que podem consumir recursos significativos da CPU e da memória. Observe que a memória alocada não é liberada até que o kernel seja desligado.

Determinados recursos e funcionalidades estão limitados a kernels específicos, conforme descrito no quadro abaixo:

Kernel Suporte à instalação da biblioteca Platform integrações
Python Sim
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R Sim
  • Sensei ML Framework
  • Catalog Service
Scala Não
  • Sensei ML Framework
  • Catalog Service

Sessões do kernel

Cada notebook ativo ou atividade em JupyterLab utiliza uma sessão de kernel. Todas as sessões ativas podem ser encontradas expandindo a guia Executando terminais e kernels na barra lateral esquerda. O tipo e o estado do kernel de um notebook podem ser identificados observando a parte superior direita da interface do notebook. No diagrama abaixo, o kernel associado do notebook é Python3 e seu estado atual é representado por um círculo cinza à direita. Um círculo oco implica um kernel ocioso e um círculo sólido implica um kernel ocupado.

Se o kernel estiver desligado ou inativo por um período prolongado, então Sem kernel! com um círculo sólido é mostrado. Ative um kernel clicando no status do kernel e selecionando o tipo de kernel apropriado, conforme demonstrado abaixo:

Iniciador

O Iniciador personalizado fornece modelos de notebook úteis para seus kernels suportados para ajudá-lo a iniciar sua tarefa, incluindo:

Modelo Descrição
Em branco Um arquivo de bloco de anotações vazio.
Início Um notebook pré-preenchido demonstrando a exploração de dados usando dados de amostra.
Vendas a varejo Um notebook pré-preenchido com a receita de vendas de varejo usando dados de amostra.
Construtor de receita Um modelo de bloco de notas para criar uma fórmula em JupyterLab. Ele é pré-preenchido com código e comentário que demonstra e descreve o processo de criação da receita. Consulte o tutorial notebook para fórmula para obter uma apresentação detalhada.
Query Service Um notebook pré-preenchido demonstrando o uso de Query Service diretamente em JupyterLab com workflows de amostra fornecidos que analisam dados em escala.
Eventos XDM Um notebook pré-preenchido demonstrando a exploração de dados nos dados do Evento da experiência de pós-valor, com foco nos recursos comuns em toda a estrutura de dados.
Query XDM Um notebook pré-preenchido demonstrando query comerciais de amostra sobre os dados do Evento Experience.
Agregação Um notebook pré-preenchido demonstrando workflows de amostra para agregação de grandes quantidades de dados em blocos menores e gerenciáveis.
Geração de cluster Um notebook pré-preenchido demonstrando o processo completo de modelagem de aprendizado de máquina usando algoritmos de cluster.

Alguns modelos de notebook estão limitados a determinados kernels. A disponibilidade do modelo para cada kernel está mapeada na seguinte tabela:

Em branco Início Vendas a varejo Construtor de receita Query Service Eventos XDM Query XDM Agregação Geração de cluster
Python sim sim sim sim sim sim não não não
R sim sim sim não não não não não não
PySpark 3 (Spark 2.4) não sim não não não não sim sim não
Scala sim sim não não não não não não sim

Para abrir um novo Iniciador, clique em Arquivo > Novo Iniciador. Como alternativa, expanda Navegador de arquivos da barra lateral esquerda e clique no símbolo de mais (+):

Configuração de GPU e servidor de memória em Python/R

Em JupyterLab, selecione o ícone de engrenagem no canto superior direito para abrir Configuração do servidor do notebook. Você pode ativar a GPU e alocar a quantidade de memória necessária usando o controle deslizante. A quantidade de memória que você pode alocar depende de quanto a sua organização provisionou. Selecione Atualizar configurações para salvar.

OBSERVAÇÃO

Somente uma GPU é provisionada por organização para notebooks. Se a GPU estiver em uso, é necessário aguardar o usuário que reservou a GPU para liberá-la. Isso pode ser feito fazendo logout ou deixando a GPU em estado ocioso por quatro ou mais horas.

Próximas etapas

Para saber mais sobre cada um dos notebooks suportados e como usá-los, visite o guia do desenvolvedor de notebooks Jupyterlab data access. Este guia foca em como usar os notebooks JupyterLab para acessar seus dados, incluindo leitura, gravação e consulta de dados. O guia de acesso a dados também contém informações sobre a quantidade máxima de dados que pode ser lida por cada notebook suportado.

Bibliotecas compatíveis

Python / R

Biblioteca Versão
notebook 6.0.0
solicitações 2,22,0
total 4.0.0
fólio 0,10,0
ipywidgets 7.5.1.
bokeh 1.3.1.
genismo 3.7.3.
ipyparalelo 0,5,2
jq 1,6
keras 2.2.4.
nltk 3.2.5.
pandas 0,22,0
pandasql 0,7,3
travesseiro 6.0.0
scikit-image 0,15,0
scikit-learn 0,21,3
cifra 1.3.0
sutura 1.3.0
seaborna 0.9.0
stats models 0,10,1
elástico 5.1.0.17
conspiração 0,11,5
py-xgover 0,90
opencv 3.4.1.
parque 2.4.3.
pirâmide 1.0.1
wxpython 4.0.6.
colorida 0.3.0
geopandas 0.5.1
piranha 2.1.0
forma 1.6.4.
rpy2 2,9,4
essenciais 3,6
r-arules 1.6_3
r-fpc 2.2_3
r-e1071 1.7_2
r-gam 1,16,1
r-gbm 2.1.5.
r-ggems 4.2.0
r-ggvis 0,4,4
r-igraph 1.2.4.1
saltos de r 3,0
manipular novamente 1.0.1
r-rocr 1.0_7
r-rmysql 0,10,17
r-rodbc 1.3_15
r-rsqlite 2.1.2.
r-rstan 2,19,2
r-sqldf 0.4_11
sobrevivência 2.44_1.1
r-zoo 1.8_6
r-stringdist 0.9.5.2
r-quadprog 1.5_7
r-rjson 0,2,20
re-previsão 8,7
r-rsolnp 1,16
r-reticulado 1,12
r-mlr 2,14,0
r-viridis 0.5.1
rondagem 0,84
r-fnn 1.1.3.
r-lubridate 1.7.4.
r-randomforest 4.6_14
r-tidyverse 1.2.1.
r-tree 1.0_39
pímono 3.8.0
pifleta 0,14,1
boto3 1.9.1999
ipyvolume 0,5,2
fast parquet 0.3.2
piritão 0,5,4
ipywebrtc 0.5.0
jupyter_client 5.3.1.
wordcloud 1.5.0
grafite 2,40,1
piton-grafviz 0,11,1
azure-armazenamento 0,36,0
jupyterlab 1.0.4.
pandas_ml 0.6.1
tensorflow-gpu 1,14,0
nodejs 12.3.0
zombaria 3.0.5.
pílula 0.3.3
fonts-anacond 1.0
psicopg2 2,8,3
nariz 1.3.7
autovizwidget 0,12,9
altair 3.1.0
vega_datasets 0.7.0
papelaria 1.0.1
sql_mágica 0,04
iso3166 1,0
nbimportador 0.3.1

PySpark

Biblioteca Versão
solicitações 2,18,4
genismo 2.3.0
keras 2,0,6
nltk 3.2.4.
pandas 0,20,1
pandasql 0,7,3
travesseiro 5.3.0
scikit-image 0,13,0
scikit-learn 0,19,0
cifra 0,19,1
sutura 1.3.3
stats models 0.8.0
elástico 4.0.30.44
py-xgover 0,60
opencv 3.1.0
pifleta 0.8.0
boto3 1.5.18
azure-armazenamento-blob 1.4.0
python 3,6,7
mkl-rt 11,1

Nesta página