Visão geral da interface do JupyterLab
- Tópicos:
- Data Science Workspace
Criado para:
- Usuário
- Desenvolvedor
JupyterLab é uma interface de usuário baseada na Web para o Projeto Jupyter e está totalmente integrada ao Adobe Experience Platform. Ele fornece um ambiente de desenvolvimento interativo para cientistas de dados trabalharem com notebooks, códigos e dados Jupyter.
Este documento fornece uma visão geral do JupyterLab e seus recursos, bem como instruções para executar ações comuns.
JupyterLab em Experience Platform
A integração do JupyterLab da Experience Platform é acompanhada de alterações de arquitetura, considerações de design, extensões personalizadas de notebooks, bibliotecas pré-instaladas e uma interface com tema Adobe.
A lista a seguir descreve alguns dos recursos exclusivos do JupyterLab no Experience Platform:
Recurso | Descrição |
---|---|
Kernels | Os kernels fornecem ao notebook e a outros front-ends do JupyterLab a capacidade de executar e introduzir código em diferentes linguagens de programação. O Experience Platform fornece kernels adicionais para dar suporte ao desenvolvimento no Python, R, PySpark e Spark. Consulte a seção kernels para obter mais detalhes. |
Acesso aos dados | Acesse os conjuntos de dados existentes diretamente do JupyterLab com suporte total para recursos de leitura e gravação. |
Experience Platformintegração de serviço | As integrações internas permitem que você utilize outros serviços do Experience Platform diretamente de dentro do JupyterLab. Uma lista completa de integrações com suporte é fornecida na seção sobre Integração com outros serviços da Experience Platform. |
Autenticação | Além do modelo de segurança interno do JupyterLab, todas as interações entre seu aplicativo e a Experience Platform, incluindo a comunicação serviço a serviço da Experience Platform, são criptografadas e autenticadas por meio do Adobe Identity Management System (IMS). |
Bibliotecas de desenvolvimento | No Experience Platform, o JupyterLab fornece bibliotecas pré-instaladas para o Python, R e PySpark. Consulte o apêndice para obter uma lista completa de bibliotecas com suporte. |
Controlador de biblioteca | Quando as bibliotecas pré-instaladas estiverem ausentes para suas necessidades, bibliotecas adicionais poderão ser instaladas para Python e R e são armazenadas temporariamente em contêineres isolados para manter a integridade do Experience Platform e manter seus dados seguros. Consulte a seção kernels para obter mais detalhes. |
Integração com outros serviços do Experience Platform
A padronização e a interoperabilidade são os principais conceitos por trás do Experience Platform. A integração do JupyterLab no Experience Platform como um IDE incorporado permite que ele interaja com outros serviços do Experience Platform, permitindo que você utilize o Experience Platform em todo o seu potencial. Os seguintes serviços Experience Platform estão disponíveis em JupyterLab:
- Catalog Service: Acesse e explore conjuntos de dados com funcionalidades de leitura e gravação.
- Query Service: Acesse e explore conjuntos de dados usando SQL, fornecendo menores despesas gerais de acesso aos dados ao lidar com grandes quantidades de dados.
- Sensei ML Framework: Desenvolvimento de modelos com a capacidade de treinar e pontuar dados, bem como criação de receitas com um único clique.
- Experience Data Model (XDM): A padronização e a interoperabilidade são os principais conceitos por trás do Adobe Experience Platform. O Experience Data Model (XDM), orientado pela Adobe, é um esforço para padronizar os dados de experiência do cliente e definir esquemas para o gerenciamento da experiência do cliente.
Principais recursos e operações comuns
Informações sobre os principais recursos do JupyterLab e instruções sobre como executar operações comuns são fornecidas nas seções abaixo:
Acessar JupyterLab
Em Adobe Experience Platform, selecione Blocos de Anotações na coluna de navegação esquerda. Aguarde algum tempo para que JupyterLab seja totalmente inicializado.
Interface JupyterLab
A interface JupyterLab consiste em uma barra de menus, uma barra lateral esquerda que pode ser recolhida e a área de trabalho principal que contém guias de documentos e atividades.
Barra de menus
A barra de menus na parte superior da interface tem menus de nível superior que expõem as ações disponíveis em JupyterLab com seus atalhos de teclado:
- Arquivo: Ações relacionadas a arquivos e diretórios
- Editar: Ações relacionadas à edição de documentos e outras atividades
- Exibir: Ações que alteram a aparência de JupyterLab
- Executar: Ações para executar código em diferentes atividades, como blocos de anotações e consoles de código
- Kernel: ações para gerenciar kernels
- Guias: Uma lista de documentos e atividades abertos
- Configurações: configurações comuns e um editor de configurações avançado
- Ajuda: Uma lista de JupyterLab e links de ajuda do kernel
Barra lateral esquerda
A barra lateral esquerda contém guias clicáveis que fornecem acesso aos seguintes recursos:
- Navegador de arquivos: Uma lista de diretórios e documentos de bloco de anotações salvos
- Data Explorer: Navegue, acesse e explore conjuntos de dados e esquemas
- Executando kernels e terminais: Uma lista de sessões ativas de kernel e terminal com a capacidade de terminar
- Comandos: Uma lista de comandos úteis
- Inspetor de células: um editor de células que fornece acesso a ferramentas e metadados úteis para a configuração de um bloco de anotações para fins de apresentação
- guias: Uma lista de guias abertas
Selecione uma guia para expor seus recursos ou selecione em uma guia expandida para recolher a barra lateral esquerda, conforme demonstrado abaixo:
Área de trabalho principal
A área de trabalho principal do JupyterLab permite que você organize documentos e outras atividades em painéis de guias que podem ser redimensionadas ou subdivididas. Arraste uma guia até o centro de um painel de guias para migrá-la. Divida um painel arrastando uma guia para a esquerda, direita, parte superior ou parte inferior do painel:
Configuração do servidor de GPU e memória em Python/R
Em JupyterLab, selecione o ícone de engrenagem no canto superior direito para abrir a Configuração do Notebook Server. Você pode ativar a GPU e alocar a quantidade de memória necessária usando o controle deslizante. A quantidade de memória que você pode alocar depende do quanto sua organização provisionou. Selecione Atualizar configurações para salvar.
Encerrar e reiniciar JupyterLab
No JupyterLab, você pode encerrar sua sessão para impedir que outros recursos sejam usados. Comece selecionando o ícone de energia
Para reiniciar JupyterLab, selecione o ícone de reiniciar
Células de código
As células de código são o conteúdo principal dos notebooks. Eles contêm código-fonte na linguagem do kernel associado do notebook e a saída como resultado da execução da célula de código. Uma contagem de execução é exibida à direita de cada célula de código que representa sua ordem de execução.
As ações comuns das células são descritas abaixo:
-
Adicionar uma célula: Clique no símbolo de mais (+) no menu de bloco de anotações para adicionar uma célula vazia. As novas células são colocadas sob a célula com a qual está ocorrendo a interação no momento, ou no final do bloco de anotações se nenhuma célula em particular estiver em foco.
-
Mover uma célula: Coloque o cursor à direita da célula que deseja mover, clique e arraste a célula para um novo local. Além disso, mover uma célula de um notebook para outro replica a célula junto com seu conteúdo.
-
Execute uma célula: Clique no corpo da célula que deseja executar e clique no ícone reproduzir () no menu do bloco de anotações. Um asterisco (*) é exibido no contador de execução da célula quando o kernel está processando a execução e é substituído por um número inteiro após a conclusão.
-
Excluir uma célula: clique no corpo da célula que deseja excluir e clique no ícone tesoura.
Kernels
Os kernels notebooks são os mecanismos de computação específicos da linguagem para o processamento de células de notebook. Além do Python, o JupyterLab fornece suporte adicional a idiomas no R, PySpark e Spark (Scala). Quando você abre um documento de notebook, o kernel associado é iniciado. Quando uma célula de notebook é executada, o kernel executa o cálculo e produz resultados que podem consumir significantes recursos de CPU e memória. Observe que a memória alocada não é liberada até que o kernel seja desligado.
Certos recursos e funcionalidades são limitados a kernels específicos, conforme descrito na tabela abaixo:
- Sensei ML Framework
- Catalog Service
- Query Service
- Sensei ML Framework
- Catalog Service
- Sensei ML Framework
- Catalog Service
Sessões de kernel
Cada bloco de anotações ou atividade ativa no JupyterLab usa uma sessão do kernel. Todas as sessões ativas podem ser encontradas expandindo a guia Terminais e kernels em execução na barra lateral esquerda. O tipo e o estado do kernel de um notebook podem ser identificados observando-se o canto superior direito da interface do notebook. No diagrama abaixo, o kernel associado do bloco de anotações é Python3 e seu estado atual é representado por um círculo cinza à direita. Um círculo oco implica um kernel ocioso e um círculo sólido implica um kernel ocupado.
Se o kernel estiver desligado ou inativo por um período prolongado, Não há kernel! com um círculo sólido é exibido. Ative um kernel clicando no status do kernel e selecionando o tipo de kernel apropriado como demonstrado abaixo:
Iniciador
O Iniciador personalizado fornece modelos de bloco de anotações úteis para que os kernels com suporte o ajudem a iniciar sua tarefa, incluindo:
Alguns modelos de notebook estão limitados a determinados kernels. A disponibilidade de modelo para cada kernel é mapeada na seguinte tabela:
Para abrir um novo Iniciador, clique em Arquivo > Novo Iniciador. Como alternativa, expanda o Navegador de arquivos da barra lateral esquerda e clique no símbolo de mais (+):
Próximas etapas
Para saber mais sobre cada um dos notebooks compatíveis e como usá-los, visite o guia do desenvolvedor do acesso aos dados dos notebooks Jupyterlab. Este guia tem como foco o uso de notebooks JupyterLab para acessar seus dados, incluindo leitura, gravação e consulta de dados. O guia de acesso a dados também contém informações sobre a quantidade máxima de dados que podem ser lidos por cada notebook suportado.
Bibliotecas compatíveis
Para obter uma lista de pacotes compatíveis com o Python, R e PySpark, copie e cole !conda list
em uma nova célula e execute a célula. Uma lista de pacotes suportados é preenchida em ordem alfabética.
Além disso, as seguintes dependências são usadas, mas não listadas:
- CUDA 11.2
- CUDNN 8.1