Visão geral da interface do JupyterLab

NOTE
O Data Science Workspace não está mais disponível para compra.
Esta documentação destina-se aos clientes existentes com direitos anteriores ao Data Science Workspace.

JupyterLab é uma interface de usuário baseada na Web para o Projeto Jupyter e está totalmente integrada ao Adobe Experience Platform. Ele fornece um ambiente de desenvolvimento interativo para cientistas de dados trabalharem com notebooks, códigos e dados Jupyter.

Esta documento fornece uma visão geral e JupyterLab seus recursos, bem como instruções para executar ações comuns.

JupyterLab em Experience Platform

A integração do JupyterLab da Experience Platform é acompanhada de mudanças de arquitetura, considerações de projeto, extensões personalizadas de notebook, bibliotecas pré-instalados e interface com tema Adobe Systems.

A lista a seguir descreve alguns dos recursos exclusivos do JupyterLab na plataforma:

Recurso
Descrição
Kernels
Os kernels fornecem ao notebook e a outros front-ends do JupyterLab a capacidade de executar e introduzir código em diferentes linguagens de programação. O Experience Platform fornece kernels adicionais para dar suporte ao desenvolvimento no Python, R, PySpark e Spark. Consulte a seção kernels para obter mais detalhes.
Acesso aos dados
Acesse os conjuntos de dados existentes diretamente do JupyterLab com suporte total para recursos de leitura e gravação.
Platformintegração de serviço
As integrações internas permitem que você utilize outros serviços do Platform diretamente de dentro do JupyterLab. Uma lista completa de integrações com suporte é fornecida na seção sobre Integração com outros serviços da plataforma.
Autenticação
Além do modelo de segurança interno do JupyterLab, todas as interações entre seu aplicativo e Experience Platform, incluindo a comunicação serviço a serviço da plataforma, são criptografadas e autenticadas por meio do Adobe Identity Management System (IMS).
Bibliotecas de desenvolvimento
No Experience Platform, o JupyterLab fornece bibliotecas pré-instaladas para o Python, R e PySpark. Consulte o apêndice para obter uma lista completa de bibliotecas com suporte.
Controlador de biblioteca
Quando as bibliotecas pré-instaladas estiverem ausentes para suas necessidades, bibliotecas adicionais poderão ser instaladas para Python e R e são armazenadas temporariamente em contêineres isolados para manter a integridade do Platform e manter seus dados seguros. Consulte a seção kernels para obter mais detalhes.
NOTE
Bibliotecas adicionais só estão disponíveis para a sessão em que foram instaladas. Você deve reinstalar todas as bibliotecas adicionais necessárias ao iniciar novas sessões.

Integração com outros serviços do Platform service-integration

A padronização e a interoperabilidade são os principais conceitos por trás do Experience Platform. A integração do JupyterLab no Platform como um IDE incorporado permite que ele interaja com outros serviços do Platform, permitindo que você utilize o Platform em todo o seu potencial. Os seguintes serviços Platform estão disponíveis em JupyterLab:

  • Catalog Service: Acesse e explore conjuntos de dados com funcionalidades de leitura e gravação.
  • Query Service: Acesse e explore conjuntos de dados usando SQL, fornecendo menores despesas gerais de acesso aos dados ao lidar com grandes quantidades de dados.
  • Sensei ML Framework: Desenvolvimento de modelos com a capacidade de treinar e pontuar dados, bem como criação de receitas com um único clique.
  • Experience Data Model (XDM): A padronização e a interoperabilidade são os principais conceitos por trás do Adobe Experience Platform. O Experience Data Model (XDM), orientado por Adobe, é um esforço para padronizar os dados de experiência do cliente e definir esquemas para o gerenciamento da experiência do cliente.
NOTE
Algumas Platform integrações de serviço em JupyterLab estão limitadas a kernels específicos. Consulte a seção sobre kernels para obter mais detalhes.

Principais recursos e operações comuns

Informações sobre os principais recursos do JupyterLab e instruções sobre como executar operações comuns são fornecidas nas seções abaixo:

Acessar JupyterLab access-jupyterlab

Em Adobe Experience Platform, selecione Blocos de Anotações na coluna de navegação esquerda. Aguarde algum tempo para que JupyterLab seja totalmente inicializado.

Interface JupyterLab jupyterlab-interface

A interface JupyterLab consiste em uma barra de menus, uma barra lateral esquerda que pode ser recolhida e a área de trabalho principal que contém guias de documentos e atividades.

Barra de menus

A barra de menus na parte superior da interface tem menus de nível superior que expõem as ações disponíveis em JupyterLab com seus atalhos de teclado:

  • Arquivo: Ações relacionadas a arquivos e diretórios
  • Editar: Ações relacionadas à edição de documentos e outras atividades
  • Exibir: Ações que alteram a aparência de JupyterLab
  • Executar: Ações para executar código em diferentes atividades, como blocos de anotações e consoles de código
  • Kernel: ações para gerenciar kernels
  • Guias: Uma lista de documentos e atividades abertos
  • Configurações: configurações comuns e um editor de configurações avançado
  • Ajuda: Uma lista de JupyterLab e links de ajuda do kernel

Barra lateral esquerda

A barra lateral esquerda contém guias clicáveis que fornecem acesso aos seguintes recursos:

  • Navegador de arquivos: Uma lista de diretórios e documentos de bloco de anotações salvos
  • Data Explorer: Navegue, acesse e explore conjuntos de dados e esquemas
  • Executando kernels e terminais: Uma lista de sessões ativas de kernel e terminal com a capacidade de terminar
  • Comandos: uma lista de comandos úteis
  • Inspetor de células: Um editor de célula que fornece acesso às ferramentas e metadados útil para a configuração de um notebook para fins de apresentação
  • guias: uma lista de guias abertas

Selecione uma guia para expor seus recursos ou selecione em uma guia expandida para recolher a barra lateral esquerda, conforme demonstrado abaixo:

Área de trabalho principal

A área de trabalho principal do JupyterLab permite que você organize documentos e outras atividades em painéis de guias que podem ser redimensionadas ou subdivididas. Arraste uma guia até o centro de um painel de guias para migrá-la. Divida um painel arrastando uma guia para a esquerda, direita, parte superior ou parte inferior do painel:

Configuração do servidor de GPU e memória em Python/R

Em JupyterLab, selecione o ícone de engrenagem no canto superior direito para abrir a Configuração do Notebook Server. Você pode ativar a GPU e alocar a quantidade de memória necessária usando o controle deslizante. A quantidade de memória que você pode alocar depende do quanto sua organização provisionou. Selecione Atualizar configurações para salvar.

NOTE
Apenas uma GPU é provisionada por organização para notebooks. Se a GPU estiver em uso, você precisará aguardar o usuário que reservou a GPU para liberá-la. Isso pode ser feito fazendo logout ou deixando a GPU em estado ocioso por quatro horas ou mais.

Encerrar e reiniciar JupyterLab

No JupyterLab, você pode encerrar sua sessão para impedir que outros recursos sejam usados. Comece selecionando o ícone de energia ícone de energia e selecione Desligar no popover que parece encerrar sua sessão. As sessões de notebook são encerradas automaticamente após 12 horas sem atividade.

Para reiniciar JupyterLab, selecione o ícone de reiniciar ícone de reiniciar localizado diretamente à esquerda do ícone de energia e selecione Reiniciar no popover exibido.

finalizar jupyterlab

Células de código code-cells

As células de código são o conteúdo principal dos notebooks. Eles contêm código-fonte na linguagem do kernel associado do notebook e a saída como resultado da execução da célula de código. Uma contagem de execução é exibida à direita de cada célula de código que representa sua ordem de execução.

As ações comuns das células são descritas abaixo:

  • Adicionar uma célula: Clique no símbolo de mais (+) no menu de bloco de anotações para adicionar uma célula vazia. As novas células são colocadas sob a célula com a qual está ocorrendo a interação no momento, ou no final do bloco de anotações se nenhuma célula em particular estiver em foco.

  • Mover uma célula: Coloque o cursor à direita da célula que deseja mover, clique e arraste a célula para um novo local. Além disso, mover uma célula de um notebook para outro replica a célula junto com seu conteúdo.

  • Execute uma célula: Clique no corpo da célula que deseja executar e clique no ícone reproduzir () no menu do bloco de anotações. Um asterisco (*) é exibido no contador de execução da célula quando o kernel está processando a execução e é substituído por um número inteiro após a conclusão.

  • Excluir uma célula: clique no corpo da célula que deseja excluir e clique no ícone tesoura.

Kernels kernels

Os kernels notebooks são os mecanismos de computação específicos da linguagem para o processamento de células de notebook. Além do Python, o JupyterLab fornece suporte adicional a idiomas no R, PySpark e Spark (Scala). Quando você abre um documento de notebook, o kernel associado é iniciado. Quando uma célula de notebook é executada, o kernel executa o cálculo e produz resultados que podem consumir recursos significativos da CPU e da memória. Observe que a memória alocada não é liberada até que o kernel seja desligado.

Certos recursos e funcionalidades são limitados a kernels específicos, conforme descrito na tabela abaixo:

Kernel
Suporte à instalação da biblioteca
Platform integrações
Python
Sim
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R
Sim
  • Sensei ML Framework
  • Catalog Service
Escala
Não
  • Sensei ML Framework
  • Catalog Service

Sessões de kernel kernel-sessions

Cada bloco de anotações ou atividade ativa no JupyterLab usa uma sessão do kernel. Todas as sessões ativas podem ser encontradas expandindo a guia Terminais e kernels em execução na barra lateral esquerda. O tipo e o estado do kernel de um notebook podem ser identificados observando-se o canto superior direito da interface do notebook. No diagrama abaixo, o kernel associado do bloco de anotações é Python3 e seu estado atual é representado por um círculo cinza à direita. Um círculo oco implica um kernel ocioso e um círculo sólido implica um kernel ocupado.

Se o kernel estiver desligado ou inativo por um período prolongado, Não há kernel! com um círculo sólido é exibido. Ative um kernel clicando no status do kernel e selecionando o tipo de kernel apropriado como demonstrado abaixo:

Iniciador launcher

O Iniciador personalizado fornece modelos de bloco de anotações úteis para que os kernels com suporte o ajudem a iniciar sua tarefa, incluindo:

Modelo
Descrição
Em branco
Um arquivo de bloco de anotações vazio.
Início
Um notebook pré-preenchido demonstrando a exploração de dados usando amostras de dados.
Vendas de varejo
Um bloco de anotações pré-preenchido com a fórmula de vendas de varejo usando dados de exemplo.
Construtor de fórmula
Um modelo de bloco de anotações para criar uma fórmula em JupyterLab. Ele é pré-preenchido com código e comentários que demonstram e descrevem o processo de criação da fórmula. Consulte o tutorial do bloco de anotações para a fórmula para obter uma apresentação detalhada.
Query Service
Um notebook pré-preenchido demonstrando o uso diretamente com Query Service o fornecido workflows de amostra que analisa dados em JupyterLab escala.
Eventos XDM
Um notebook pré-preenchido demonstrando a exploração de dados em dados de evento de experiência pós-valor, com foco em recursos comuns em toda a estrutura de dados.
Consultas XDM
Um notebook pré-preenchido demonstrando amostras de consultas comerciais nos dados do Experience Event.
Agregação
Um notebook pré-preenchido demonstrando fluxos de trabalho de amostra para agregar grandes quantidades de dados em blocos menores e gerenciáveis.
Geração de cluster
Um notebook pré-preenchido demonstrando o processo completo de modelagem de aprendizado de máquina usando algoritmos de cluster.

Alguns modelos de notebook estão limitados a determinados kernels. A disponibilidade de modelo para cada kernel é mapeada na seguinte tabela:

Em branco
Início
Vendas de varejo
Construtor de fórmula
Query Service
Eventos XDM
Consultas XDM
Agregação
Clustering
Python
sim
sim
sim
sim
sim
sim
não
não
não
R
sim
sim
sim
não
não
não
não
não
não
PySpark 3 (Spark 2.4)
não
sim
não
não
não
não
sim
sim
não
Scala
sim
sim
não
não
não
não
não
não
sim

Para abrir um novo Iniciador, clique em Arquivo > Novo Iniciador. Como alternativa, expanda o Navegador de arquivos da barra lateral esquerda e clique no símbolo de mais (+):

Próximas etapas

Para saber mais sobre cada um dos notebooks compatíveis e como usá-los, visite o guia do desenvolvedor do acesso aos dados dos notebooks Jupyterlab. Este guia foca em como usar notebooks JupyterLab para acessar seus dados, incluindo leitura, escrita e consulta de dados. O guia de acesso a dados também contém informações sobre a quantidade máxima de dados que podem ser lidos por cada notebook suportado.

Bibliotecas suportado supported-libraries

Para uma lista de pacotes suportados em Python, R e PySpark, copie e cole !conda list em uma nova célula, em seguida, execute a célula. Uma lista de pacotes suportados é preenchida em solicitar alfabéticos.

exemplo

Além disso, as seguintes dependências são usadas, mas não listadas:

  • CUDA 11.2
  • CUDNN 8.1
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9