JupyterLab Visão geral da interface do usuário

JupyterLab O é uma interface de usuário baseada na Web para o Project Júpiter e é totalmente integrada ao Adobe Experience Platform. Ele fornece um ambiente de desenvolvimento interativo para os cientistas de dados trabalharem com notebooks, códigos e dados do Júpiter.

Este documento fornece uma visão geral do JupyterLab e seus recursos, bem como instruções para executar ações comuns.

JupyterLab em Experience Platform

A integração do JupyterLab é acompanhada de alterações de arquitetura, considerações de design, extensões de notebook personalizadas, bibliotecas pré-instaladas e uma interface de Adobe.

A lista a seguir descreve alguns dos recursos exclusivos do JupyterLab na plataforma:

Recurso Descrição
Kernels Os kernels fornecem o notebook e outros JupyterLab front-ends com a capacidade de executar e introspectar código em diferentes linguagens de programação. Experience Platform fornece kernels adicionais para suportar o desenvolvimento no Python, R, PySpark e Spark. Consulte a seção kernels para obter mais detalhes.
Acesso aos dados Acesse conjuntos de dados existentes diretamente de JupyterLab com suporte total para recursos de leitura e gravação.
Platformintegração de serviço As integrações integradas permitem utilizar outros serviços Platform diretamente de JupyterLab. Uma lista completa de integrações compatíveis é fornecida na seção Integration with other Platform services.
Autenticação Além do modelo de segurança integrado do JupyterLab, todas as interações entre seu aplicativo e o Experience Platform, incluindo a comunicação entre serviços da plataforma, são criptografadas e autenticadas por meio do Adobe Identity Management System (IMS).
Bibliotecas de desenvolvimento Em Experience Platform, JupyterLab fornece bibliotecas pré-instaladas para Python, R e PySpark. Consulte o apêndice para obter uma lista completa das bibliotecas compatíveis.
Controlador de biblioteca Quando as bibliotecas pré-instaladas não atendem às suas necessidades, bibliotecas adicionais podem ser instaladas para Python e R, e são armazenadas temporariamente em contêineres isolados para manter a integridade de Platform e manter seus dados seguros. Consulte a seção kernels para obter mais detalhes.
OBSERVAÇÃO

Bibliotecas adicionais só estão disponíveis para a sessão em que foram instaladas. Você deve reinstalar as bibliotecas adicionais necessárias ao iniciar novas sessões.

Integração com outros serviços Platform

A normalização e a interoperabilidade são conceitos-chave subjacentes a Experience Platform. A integração de JupyterLab em Platform como um IDE incorporado permite que ele interaja com outros Platform serviços, permitindo que você utilize Platform ao seu máximo potencial. Os seguintes serviços Platform estão disponíveis em JupyterLab:

  • Catalog Service: acesse e explore conjuntos de dados com funcionalidades de leitura e gravação.
  • Query Service: acesse e explore conjuntos de dados usando o SQL, fornecendo custos indiretos de acesso a dados mais baixos ao lidar com grandes quantidades de dados.
  • Sensei ML Framework: desenvolvimento de modelo com a capacidade de treinar e pontuar dados, bem como criação de receita com um único clique.
  • Experience Data Model (XDM): A padronização e a interoperabilidade são conceitos-chave do Adobe Experience Platform. O Experience Data Model (XDM), orientado pelo Adobe, é um esforço para padronizar os dados de experiência do cliente e definir esquemas para o gerenciamento da experiência do cliente.
OBSERVAÇÃO

Algumas integrações de serviço Platform em JupyterLab estão limitadas a kernels específicos. Consulte a seção sobre kernels para obter mais detalhes.

Principais recursos e operações comuns

As informações sobre os principais recursos de JupyterLab e as instruções sobre como executar operações comuns são fornecidas nas seções abaixo:

Access JupyterLab

Em Adobe Experience Platform, selecione Notebooks na coluna de navegação esquerda. Permita que JupyterLab inicialize totalmente.

JupyterLab interface

A interface JupyterLab consiste em uma barra de menu, uma barra lateral esquerda que pode ser recolhida e a área de trabalho principal que contém guias de documentos e atividades.

Barra de menus

A barra de menu na parte superior da interface tem menus de nível superior que expõem as ações disponíveis em JupyterLab com os atalhos de teclado:

  • Arquivo: ações relacionadas a arquivos e diretórios
  • Editar: ações relacionadas à edição de documentos e outras atividades
  • Exibir: ações que alteram a aparência de JupyterLab
  • Executar: ações para executar código em atividades diferentes, como blocos de anotações e consoles de código
  • Kernel: Ações para gerenciar kernels
  • Guias: uma lista de documentos e atividades abertos
  • Configurações: Configurações comuns e um editor de configurações avançado
  • Ajuda: Uma lista de links de ajuda do kernel JupyterLab e do

Barra lateral esquerda

A barra lateral esquerda contém guias clicáveis que fornecem acesso aos seguintes recursos:

  • Navegador de arquivos: uma lista de documentos e diretórios do notebook salvos
  • Data Explorer: navegue, acesse e explore conjuntos de dados e esquemas
  • Rastreamento de kernels e terminais: uma lista de sessões ativas do kernel e do terminal com capacidade de terminar
  • Comandos: uma lista de comandos úteis
  • Inspetor de célula: um editor de célula que fornece acesso a ferramentas e metadados úteis para a configuração de um bloco de notas para fins de apresentação
  • guias: uma lista de guias abertas

Selecione uma guia para expor seus recursos ou selecione em uma guia expandida para recolher a barra lateral esquerda, conforme mostrado abaixo:

Área de trabalho principal

A área de trabalho principal em JupyterLab permite organizar documentos e outras atividades em painéis de guias que podem ser redimensionadas ou subdivididas. Arraste uma guia até o centro de um painel de guias para migrar a guia . Divida um painel arrastando uma guia para a esquerda, direita, superior ou inferior do painel:

Configuração da GPU e do servidor de memória em Python/R

Em JupyterLab, selecione o ícone de engrenagem no canto superior direito para abrir Configuração do servidor do notebook. Você pode ativar a GPU e alocar a quantidade de memória necessária usando o controle deslizante . A quantidade de memória que você pode alocar depende de quanto sua organização provisionou. Selecione Update configs para salvar.

OBSERVAÇÃO

Somente uma GPU é provisionada por organização para notebooks. Se a GPU estiver em uso, é necessário aguardar até que o usuário que reservou a GPU no momento a libere. Isso pode ser feito fazendo logoff ou deixando a GPU em um estado inativo por quatro ou mais horas.

Encerrar e reiniciar JupyterLab

Em JupyterLab, você pode encerrar a sessão para impedir que outros recursos sejam usados. Comece selecionando o ícone de energia ícone de energia e selecione Shut Down no portão que aparece para terminar a sessão. As sessões do notebook terminam automaticamente após 12 horas sem atividade.

Para reiniciar JupyterLab, selecione o ícone de reinicialização ícone de reinicialização localizado diretamente à esquerda do ícone de energia e selecione Restart na parte superior exibida.

rescindir o jupyterlab

Células de código

As células de código são o conteúdo principal dos blocos de anotações. Eles contêm o código-fonte no idioma do kernel associado do notebook e a saída como resultado da execução da célula de código. Uma contagem de execução é exibida à direita de cada célula de código que representa sua ordem de execução.

As ações comuns das células são descritas abaixo:

  • Adicionar uma célula: Clique no símbolo de mais (+) no menu do bloco de notas para adicionar uma célula vazia. Novas células são colocadas sob a célula com a qual está sendo interagida no momento ou no final do notebook se nenhuma célula específica estiver em foco.

  • Mover uma célula: Coloque o cursor à direita da célula que deseja mover e clique e arraste a célula para um novo local. Além disso, mover uma célula de um notebook para outro replica a célula junto com seu conteúdo.

  • Executar uma célula: Clique no corpo da célula que você deseja executar e clique no ​ícone de reprodução () no menu do bloco de notas. Um asterisco (*) é exibido no contador de execução da célula quando o kernel está processando a execução e é substituído por um inteiro após a conclusão.

  • Excluir uma célula: clique no corpo da célula que deseja excluir e clique no ícone de ​scissoricon.

Kernels

Os kernels de notebook são os mecanismos de computação específicos da linguagem para o processamento de células de notebook. Além de Python, JupyterLab fornece suporte adicional de idioma em R, PySpark e Spark (Scala). Quando você abre um documento de notebook, o kernel associado é iniciado. Quando uma célula de notebook é executada, o kernel executa o cálculo e produz resultados que podem consumir recursos significativos de CPU e memória. Observe que a memória alocada não é liberada até que o kernel seja desligado.

Determinados recursos e funcionalidades estão limitados a kernels específicos, conforme descrito na tabela abaixo:

Kernel Suporte para instalação de biblioteca Platform integrações
Python Sim
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R Sim
  • Sensei ML Framework
  • Catalog Service
Scala Não
  • Sensei ML Framework
  • Catalog Service

Sessões do kernel

Cada bloco de anotações ativo ou atividade em JupyterLab utiliza uma sessão de kernel. Todas as sessões ativas podem ser encontradas expandindo a guia Running terminais and kernels da barra lateral esquerda. O tipo e o estado do kernel de um notebook podem ser identificados observando a parte superior direita da interface do notebook. No diagrama abaixo, o kernel associado do notebook é Python3 e seu estado atual é representado por um círculo cinza à direita. Um círculo oco implica um kernel em marcha lenta sem carga e um círculo sólido implica um kernel ocupado.

Se o kernel for desligado ou inativo por um período prolongado, No Kernel! com um círculo sólido é mostrado. Ative um kernel clicando no status do kernel e selecionando o tipo de kernel apropriado, conforme mostrado abaixo:

Iniciador

O Launcher personalizado fornece modelos de notebook úteis para seus kernels suportados para ajudá-lo a iniciar sua tarefa, incluindo:

Modelo Descrição
Em branco Um arquivo de bloco de notas vazio.
Início Um notebook pré-preenchido demonstrando a exploração de dados usando dados de amostra.
Vendas de varejo Um notebook pré-preenchido com a receita vendas de varejo usando dados de amostra.
Criador de receita Um modelo de bloco de notas para criar uma receita em JupyterLab. Ele é pré-preenchido com código e comentário que demonstra e descreve o processo de criação da receita. Consulte o tutorial de notebook a receita para obter uma apresentação detalhada.
Query Service Um notebook pré-preenchido demonstrando o uso de Query Service diretamente em JupyterLab com fluxos de trabalho de amostra fornecidos que analisam dados em escala.
Eventos XDM Um notebook pré-preenchido que demonstra a exploração de dados em dados de evento de experiência de pós-valor, com foco em recursos comuns na estrutura de dados.
Consultas XDM Um notebook pré-preenchido demonstrando consultas comerciais de amostra em dados de eventos de experiência.
Agregação Um notebook pré-preenchido demonstrando fluxos de trabalho de amostra para agregar grandes quantidades de dados em partes menores e gerenciáveis.
Geração de cluster Um notebook pré-preenchido demonstrando o processo completo de modelagem de aprendizado de máquina usando algoritmos de cluster.

Alguns modelos de notebook estão limitados a certos kernels. A disponibilidade do modelo para cada kernel é mapeada na tabela a seguir:

Em branco Início Vendas de varejo Criador de receita Query Service Eventos XDM Consultas XDM Agregação Geração de cluster
Python sim sim sim sim sim sim não não não
R sim sim sim não não não não não não
PySpark 3 (Spark 2.4) não sim não não não não sim sim não
Scala sim sim não não não não não não sim

Para abrir um novo Iniciador, clique em Arquivo > Novo Iniciador. Como alternativa, expanda o File browser da barra lateral esquerda e clique no símbolo de mais (+):

Próximas etapas

Para saber mais sobre cada um dos notebooks suportados e como usá-los, visite o Guia do desenvolvedor de acesso a dados dos notebooks Jupyterlab. Este guia se concentra em como usar os notebooks JupyterLab para acessar seus dados, incluindo leitura, escrita e consulta de dados. O guia de acesso a dados também contém informações sobre a quantidade máxima de dados que podem ser lidos por cada notebook suportado.

Bibliotecas compatíveis

Para obter uma lista de pacotes suportados em Python, R e PySpark, copie e cole !pip list --format=columns em uma nova célula e, em seguida, execute a célula. Uma lista de pacotes suportados é preenchida em ordem alfabética.

exemplo

Nesta página