JupyterLab Visão geral da interface do usuário

JupyterLab é uma interface do usuário baseada na Web para Jupyter do projeto e é totalmente integrado ao Adobe Experience Platform. Ele fornece um ambiente de desenvolvimento interativo para os cientistas de dados trabalharem com notebooks, códigos e dados do Júpiter.

Este documento fornece uma visão geral de JupyterLab e seus recursos, bem como instruções para executar ações comuns.

JupyterLab em Experience Platform

A integração do JupyterLab é acompanhada de alterações de arquitetura, considerações de design, extensões de notebook personalizadas, bibliotecas pré-instaladas e uma interface de Adobe.

A lista a seguir descreve alguns dos recursos exclusivos do JupyterLab na plataforma:

Recurso Descrição
Kernels Kernels fornecem notebook e outros JupyterLab O front-end é a capacidade de executar e inserir código em diferentes linguagens de programação. Experience Platform fornece kernels adicionais para apoiar o desenvolvimento no Python, R, PySpark e Spark. Consulte a kernels para obter mais detalhes.
Acesso aos dados Acessar conjuntos de dados existentes diretamente de dentro do JupyterLab com suporte total para recursos de leitura e gravação.
Platformintegração de serviço Integrações integradas permitem utilizar outros Platform serviços diretamente de dentro JupyterLab. Uma lista completa de integrações compatíveis é fornecida na seção sobre Integração com outros serviços da plataforma.
Autenticação Além de Modelo de segurança integrado do JupyterLab, todas as interações entre seu aplicativo e o Experience Platform, incluindo a comunicação entre serviços da plataforma, são criptografadas e autenticadas por meio do Adobe Identity Management System (IMS).
Bibliotecas de desenvolvimento Em Experience Platform, JupyterLab O fornece bibliotecas pré-instaladas para Python, R e PySpark. Consulte a apêndice para obter uma lista completa das bibliotecas compatíveis.
Controlador de biblioteca Quando as bibliotecas pré-instaladas não atendem às suas necessidades, bibliotecas adicionais podem ser instaladas para Python e R e são armazenadas temporariamente em contêineres isolados para manter a integridade do Platform e manter seus dados seguros. Consulte a kernels para obter mais detalhes.
OBSERVAÇÃO

Bibliotecas adicionais só estão disponíveis para a sessão em que foram instaladas. Você deve reinstalar as bibliotecas adicionais necessárias ao iniciar novas sessões.

Integração com outras Platform serviços

A normalização e a interoperabilidade são conceitos-chave subjacentes Experience Platform. A integração de JupyterLab on Platform como um IDE incorporado permite que ele interaja com outros Platform , permitindo utilizar Platform ao seu pleno potencial. O seguinte Platform estão disponíveis em JupyterLab:

  • Catalog Service: Acesse e explore conjuntos de dados com funcionalidades de leitura e gravação.
  • Query Service: Acesse e explore conjuntos de dados usando o SQL, fornecendo custos indiretos de acesso a dados mais baixos ao lidar com grandes quantidades de dados.
  • Sensei ML Framework: Desenvolvimento de modelo com a capacidade de treinar e pontuar dados, bem como criação de receita com um único clique.
  • Experience Data Model (XDM): A padronização e a interoperabilidade são conceitos-chave por trás do Adobe Experience Platform. Experience Data Model (XDM), impulsionada pelo Adobe, é um esforço para padronizar os dados de experiência do cliente e definir esquemas para o gerenciamento da experiência do cliente.
OBSERVAÇÃO

Algumas Platform integrações de serviço no JupyterLab são limitadas a kernels específicos. Consulte a seção em kernels para obter mais detalhes.

Principais recursos e operações comuns

Informações sobre os principais recursos do JupyterLab e as instruções relativas à realização de operações comuns são fornecidas nas seções abaixo:

Access JupyterLab

Em Adobe Experience Platform, selecione Notebooks na coluna de navegação à esquerda. Permitir algum tempo para JupyterLab para inicializar totalmente.

JupyterLab interface

O JupyterLab A interface consiste em uma barra de menu, uma barra lateral esquerda que pode ser recolhida e a área de trabalho principal contendo guias de documentos e atividades.

Barra de menus

A barra de menus na parte superior da interface tem menus de nível superior que expõem as ações disponíveis em JupyterLab com os atalhos de teclado:

  • Arquivo: Ações relacionadas a arquivos e diretórios
  • Editar: Ações relacionadas à edição de documentos e outras atividades
  • Exibir: Ações que alteram a aparência de JupyterLab
  • Executar: Ações para executar código em diferentes atividades, como blocos de anotações e consoles de código
  • Kernel: Ações para gerenciar kernels
  • Guias: Uma lista de documentos e atividades abertos
  • Configurações: Configurações comuns e um editor de configurações avançado
  • Ajuda: Uma lista de JupyterLab e links de ajuda do kernel

Barra lateral esquerda

A barra lateral esquerda contém guias clicáveis que fornecem acesso aos seguintes recursos:

  • Navegador de arquivos: Uma lista de documentos e diretórios do bloco de anotações salvos
  • Data Explorer: Navegar, acessar e explorar conjuntos de dados e esquemas
  • Corta e terminais de comando: Uma lista de sessões ativas do kernel e do terminal com a capacidade de encerrar
  • Comandos: Uma lista de comandos úteis
  • Inspetor de células: Um editor de células que fornece acesso a ferramentas e metadados úteis para a configuração de um bloco de notas para fins de apresentação
  • guias: Uma lista de guias abertas

Selecione uma guia para expor seus recursos ou selecione em uma guia expandida para recolher a barra lateral esquerda, conforme mostrado abaixo:

Área de trabalho principal

A principal área de trabalho no JupyterLab permite organizar documentos e outras atividades em painéis de guias que podem ser redimensionados ou subdivididos. Arraste uma guia até o centro de um painel de guias para migrar a guia . Divida um painel arrastando uma guia para a esquerda, direita, superior ou inferior do painel:

Configuração da GPU e do servidor de memória em Python/R

Em JupyterLab selecione o ícone de engrenagem no canto superior direito para abrir Configuração do servidor de notebook. Você pode ativar a GPU e alocar a quantidade de memória necessária usando o controle deslizante . A quantidade de memória que você pode alocar depende de quanto sua organização provisionou. Selecionar Atualizar configurações para salvar.

OBSERVAÇÃO

Somente uma GPU é provisionada por organização para notebooks. Se a GPU estiver em uso, é necessário aguardar até que o usuário que reservou a GPU no momento a libere. Isso pode ser feito fazendo logoff ou deixando a GPU em um estado inativo por quatro ou mais horas.

Encerrar e reiniciar JupyterLab

Em JupyterLab, você pode encerrar a sessão para impedir que outros recursos sejam usados. Comece selecionando o ícone de potência ícone de potência, em seguida selecione Desligar do fornecedor que parece terminar a sessão. As sessões do notebook terminam automaticamente após 12 horas sem atividade.

Para reiniciar JupyterLab, selecione o ícone reiniciar ícone reiniciar localizado diretamente à esquerda do ícone de energia e, em seguida, selecione Reiniciar do poder que aparece.

rescindir o jupyterlab

Células de código

As células de código são o conteúdo principal dos blocos de anotações. Eles contêm o código-fonte no idioma do kernel associado do notebook e a saída como resultado da execução da célula de código. Uma contagem de execução é exibida à direita de cada célula de código que representa sua ordem de execução.

As ações comuns das células são descritas abaixo:

  • Adicionar uma célula: Clique no símbolo de mais (+) no menu do bloco de anotações para adicionar uma célula vazia. Novas células são colocadas sob a célula com a qual está sendo interagida no momento ou no final do notebook se nenhuma célula específica estiver em foco.

  • Mover uma célula: Coloque o cursor à direita da célula que deseja mover e clique e arraste a célula para um novo local. Além disso, mover uma célula de um notebook para outro replica a célula junto com seu conteúdo.

  • Executar uma célula: Clique no corpo da célula que deseja executar e clique no botão play ícone () no menu do notebook. Um asterisco (*) é exibido no contador de execução da célula quando o kernel está processando a execução e é substituído por um inteiro após a conclusão.

  • Excluir uma célula: Clique no corpo da célula que deseja excluir e clique no botão tesoura ícone .

Kernels

Os kernels de notebook são os mecanismos de computação específicos da linguagem para o processamento de células de notebook. Além de Python, JupyterLab fornece suporte adicional de idioma em R, PySpark e Spark (Scala). Quando você abre um documento de notebook, o kernel associado é iniciado. Quando uma célula de notebook é executada, o kernel executa o cálculo e produz resultados que podem consumir recursos significativos de CPU e memória. Observe que a memória alocada não é liberada até que o kernel seja desligado.

Determinados recursos e funcionalidades estão limitados a kernels específicos, conforme descrito na tabela abaixo:

Kernel Suporte para instalação de biblioteca Platform integrações
Python Sim
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R Sim
  • Sensei ML Framework
  • Catalog Service
Scala Não
  • Sensei ML Framework
  • Catalog Service

Sessões do kernel

Cada bloco de anotações ativo ou atividade em JupyterLab O usa uma sessão do kernel. Todas as sessões ativas podem ser encontradas expandindo o Terminais e kernels em funcionamento na barra lateral esquerda. O tipo e o estado do kernel de um notebook podem ser identificados observando a parte superior direita da interface do notebook. No diagrama abaixo, o kernel associado do notebook é Python3 e o seu estado atual é representado por um círculo cinza à direita. Um círculo oco implica um kernel em marcha lenta sem carga e um círculo sólido implica um kernel ocupado.

Se o kernel for desligado ou inativo por um período prolongado, Sem kernel! com um círculo sólido é mostrado. Ative um kernel clicando no status do kernel e selecionando o tipo de kernel apropriado, conforme mostrado abaixo:

Iniciador

O Iniciador O fornece modelos de notebook úteis para seus kernels suportados para ajudá-lo a iniciar sua tarefa, incluindo:

Modelo Descrição
Em branco Um arquivo de bloco de notas vazio.
Início Um notebook pré-preenchido demonstrando a exploração de dados usando dados de amostra.
Vendas de varejo Um notebook pré-cheio com a receita de vendas de varejo uso de dados de amostra.
Criador de receita Um modelo de bloco de notas para criar uma receita em JupyterLab. Ele é pré-preenchido com código e comentário que demonstra e descreve o processo de criação da receita. Consulte a tutorial de notebook a receita para uma apresentação detalhada.
Query Service Um notebook pré-preenchido demonstrando o uso de Query Service diretamente em JupyterLab com fluxos de trabalho de amostra fornecidos que analisam dados em escala.
Eventos XDM Um notebook pré-preenchido que demonstra a exploração de dados em dados de evento de experiência de pós-valor, com foco em recursos comuns na estrutura de dados.
Consultas XDM Um notebook pré-preenchido demonstrando consultas comerciais de amostra em dados de eventos de experiência.
Agregação Um notebook pré-preenchido demonstrando fluxos de trabalho de amostra para agregar grandes quantidades de dados em partes menores e gerenciáveis.
Geração de cluster Um notebook pré-preenchido demonstrando o processo completo de modelagem de aprendizado de máquina usando algoritmos de cluster.

Alguns modelos de notebook estão limitados a certos kernels. A disponibilidade do modelo para cada kernel é mapeada na tabela a seguir:

Em branco Início Vendas de varejo Criador de receita Query Service Eventos XDM Consultas XDM Agregação Geração de cluster
Python sim sim sim sim sim sim não não não
R sim sim sim não não não não não não
PySpark 3 (Spark 2.4) não sim não não não não sim sim não
Scala sim sim não não não não não não sim

Para abrir um novo Iniciador, clique em Arquivo > Novo iniciador. Como alternativa, expanda a Navegador de arquivos na barra lateral esquerda e clique no símbolo de mais (+):

Próximas etapas

Para saber mais sobre cada um dos notebooks suportados e como usá-los, visite o Acesso aos dados dos notebooks Jupyterlab guia do desenvolvedor. Este guia se concentra em como usar os notebooks JupyterLab para acessar seus dados, incluindo leitura, escrita e consulta de dados. O guia de acesso a dados também contém informações sobre a quantidade máxima de dados que podem ser lidos por cada notebook suportado.

Bibliotecas compatíveis

Para obter uma lista de pacotes compatíveis em Python, R e PySpark, copie e cole !conda list em uma nova célula, execute a célula. Uma lista de pacotes suportados é preenchida em ordem alfabética.

exemplo

Além disso, as seguintes dependências são usadas, mas não listadas:

  • CUDA 11.2
  • CUDNN 8.1

Nesta página