JupyterLab Información general de IU

JupyterLab es una interfaz de usuario basada en la web para Project Jupyter y está totalmente integrada en Adobe Experience Platform. Proporciona un entorno de desarrollo interactivo para que los científicos de datos trabajen con Jupyter Notebooks, código y datos.

Este documento proporciona información general sobre JupyterLab y sus características, así como instrucciones para realizar acciones comunes.

JupyterLab el Experience Platform

La integración de JupyterLab de Experience Platform se acompaña de cambios arquitectónicos, consideraciones de diseño, extensiones de portátiles personalizadas, bibliotecas preinstaladas y una interfaz temática de Adobe.

La siguiente lista describe algunas de las funciones exclusivas de JupyterLab en Platform:

Función
Descripción
Núcleos
Los núcleos proporcionan al bloc de notas y a otros JupyterLab front-end la capacidad de ejecutar e inspeccionar código en diferentes lenguajes de programación. Experience Platform proporciona núcleos adicionales para admitir el desarrollo en Python, R, PySpark y Spark. Consulte la sección kernels para obtener más información.
Acceso a datos
Obtenga acceso a los conjuntos de datos existentes directamente desde JupyterLab, con compatibilidad total con las capacidades de lectura y escritura.
Platformintegración de servicio
Las integraciones integradas le permiten utilizar otros servicios de Platform directamente desde JupyterLab. Se proporciona una lista completa de las integraciones compatibles en la sección sobre Integración con otros servicios de Platform.
Autenticación
Además del modelo de seguridad integrado de JupyterLab, todas las interacciones entre su aplicación y el Experience Platform, incluida la comunicación de servicio a servicio de Platform, se cifran y se autentican mediante Adobe Identity Management System (IMS).
Bibliotecas de desarrollo
En Experience Platform, JupyterLab proporciona bibliotecas preinstaladas para Python, R y PySpark. Consulte el apéndice para obtener una lista completa de las bibliotecas admitidas.
Controlador de biblioteca
Cuando faltan las bibliotecas preinstaladas para sus necesidades, se pueden instalar bibliotecas adicionales para Python y R, y se almacenan temporalmente en contenedores aislados para mantener la integridad de Platform y mantener sus datos a salvo. Consulte la sección kernels para obtener más información.
NOTE
Las bibliotecas adicionales solo están disponibles para la sesión en la que se instalaron. Debe volver a instalar las bibliotecas adicionales que necesite al iniciar nuevas sesiones.

Integración con otros Platform servicios service-integration

La estandarización y la interoperabilidad son conceptos clave detrás de Experience Platform. La integración de JupyterLab en Platform como IDE incrustado le permite interactuar con otros servicios de Platform, lo que le permite utilizar Platform todo su potencial. Los siguientes Platform servicios están disponibles en JupyterLab:

  • Catalog Service: Acceda y explore conjuntos de datos con funcionalidades de lectura y escritura.
  • Query Service: Acceda y explore conjuntos de datos mediante SQL, lo que reduce los gastos generales de acceso a datos al tratar grandes cantidades de datos.
  • Sensei ML Framework: Desarrollo de modelos con la capacidad de entrenar y puntuar datos, así como la creación de fórmulas con un solo clic.
  • Experience Data Model (XDM): La estandarización y la interoperabilidad son conceptos clave detrás de Adobe Experience Platform. Modelo de datos de experiencia (XDM), impulsado por el Adobe, es un esfuerzo para estandarizar los datos de experiencia del cliente y definir esquemas para la administración de experiencias del cliente.
NOTE
Algunas integraciones de servicio de Platform en JupyterLab se limitan a núcleos específicos. Consulte la sección sobre kernels para obtener más información.

Funciones clave y operaciones comunes

En las secciones siguientes se proporciona información acerca de las características clave de JupyterLab e instrucciones para realizar operaciones comunes:

Acceder a JupyterLab access-jupyterlab

En Adobe Experience Platform, seleccione Notebooks de la columna de navegación izquierda. Espere un tiempo para que JupyterLab se inicialice por completo.

Interfaz de JupyterLab jupyterlab-interface

La interfaz JupyterLab consta de una barra de menús, una barra lateral izquierda contraíble y el área de trabajo principal que contiene fichas de documentos y actividades.

Barra de menús

La barra de menús de la parte superior de la interfaz tiene menús de nivel superior que exponen acciones disponibles en JupyterLab con sus métodos abreviados de teclado:

  • Archivo: Acciones relacionadas con archivos y directorios
  • Editar: acciones relacionadas con la edición de documentos y otras actividades
  • Ver: acciones que modifican el aspecto de JupyterLab
  • Ejecutar: Acciones para ejecutar código en diferentes actividades como blocs de notas y consolas de códigos
  • Núcleo: acciones para administrar núcleos
  • Fichas: Una lista de documentos y actividades abiertos
  • Configuración: Configuración común y un editor de configuración avanzada
  • Ayuda: Una lista de JupyterLab y vínculos de ayuda del núcleo

Barra lateral izquierda

La barra lateral izquierda contiene pestañas en las que se puede hacer clic y que proporcionan acceso a las siguientes funciones:

  • Explorador de archivos: Lista de documentos y directorios guardados del bloc de notas
  • Explorador de datos: Examine, acceda y explore conjuntos de datos y esquemas
  • Ejecución de kernels y terminales: Una lista de sesiones activas de kernel y terminal con la capacidad de finalizar
  • Comandos: Una lista de comandos útiles
  • Inspector de celdas: Editor de celdas que proporciona acceso a herramientas y metadatos útiles para configurar un bloc de notas con fines de presentación
  • fichas: Una lista de fichas abiertas

Seleccione una pestaña para exponer sus funciones o seleccione en una pestaña expandida para contraer la barra lateral izquierda como se muestra a continuación:

Área de trabajo principal

El área de trabajo principal de JupyterLab le permite organizar documentos y otras actividades en paneles de fichas que se pueden cambiar de tamaño o subdividir. Arrastre una pestaña al centro de un panel de pestañas para migrar la pestaña. Divida un panel arrastrando una pestaña a la izquierda, a la derecha, a la parte superior o a la parte inferior del panel:

Configuración de GPU y servidor de memoria en Python/R

En JupyterLab, seleccione el icono de engranaje en la esquina superior derecha para abrir Configuración del servidor de portátiles. Puede activar la GPU y asignar la cantidad de memoria que necesite mediante el control deslizante. La cantidad de memoria que puede asignar depende de la cantidad que haya aprovisionado su organización. Seleccione Actualizar configuraciones para guardar.

NOTE
Solo se proporciona una GPU por organización para Notebooks. Si la GPU está en uso, tendrá que esperar a que la libere el usuario que la ha reservado actualmente. Esto se puede hacer cerrando la sesión o dejando la GPU en estado inactivo durante cuatro horas o más.

Terminar y reiniciar JupyterLab

En JupyterLab, puede finalizar su sesión para evitar que se usen más recursos. Comience por seleccionar el icono de energía icono de energía y, a continuación, seleccione Apagar de la ventana emergente que aparece para finalizar su sesión. Las sesiones de Notebook finalizan automáticamente después de 12 horas de inactividad.

Para reiniciar JupyterLab, selecciona el icono de reinicio icono de reinicio que se encuentra directamente a la izquierda del icono de encendido y, a continuación, selecciona Reiniciar de la ventana emergente que aparece.

finalizar jupyterlab

Celdas de código code-cells

Las celdas de código son el contenido principal de los blocs de notas. Contienen código fuente en el idioma del núcleo asociado del bloc de notas y la salida como resultado de la ejecución de la celda de código. Se muestra un recuento de ejecución a la derecha de cada celda de código que representa su orden de ejecución.

Las acciones celulares comunes se describen a continuación:

  • Agregar una celda: Haga clic en el símbolo más (+) del menú del bloc de notas para agregar una celda vacía. Las nuevas celdas se colocan debajo de la celda con la que se está interactuando actualmente, o al final del bloc de notas si no hay ninguna celda en particular enfocada.

  • Mover una celda: Coloque el cursor a la derecha de la celda que desea mover y, a continuación, haga clic y arrastre la celda a una nueva ubicación. Además, al mover una celda de un bloc de notas a otro se replica la celda junto con su contenido.

  • Ejecutar una celda: Haga clic en el cuerpo de la celda que desea ejecutar y, a continuación, haga clic en el icono reproducir () del menú del bloc de notas. Se muestra un asterisco (*) en el contador de ejecución de la celda cuando el núcleo está procesando la ejecución y se reemplaza con un entero al finalizar.

  • Eliminar una celda: Haga clic en el cuerpo de la celda que desea eliminar y, a continuación, haga clic en el icono tijera.

Núcleos kernels

Los núcleos de los portátiles son los motores informáticos específicos del idioma para el procesamiento de las celdas de los portátiles. Además de Python, JupyterLab proporciona compatibilidad con idiomas adicional en R, PySpark y Spark (Scala). Al abrir un documento de bloc de notas, se inicia el núcleo asociado. Cuando se ejecuta una celda de un bloc de notas, el núcleo realiza el cálculo y produce resultados que pueden consumir recursos significativos de CPU y memoria. Tenga en cuenta que la memoria asignada no se libera hasta que se apaga el núcleo.

Ciertas características y funcionalidades están limitadas a núcleos particulares como se describe en la tabla siguiente:

Núcleo
Compatibilidad con instalación de biblioteca
Integraciones de Platform
Python
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R
  • Sensei ML Framework
  • Catalog Service
Scala
No
  • Sensei ML Framework
  • Catalog Service

Sesiones de kernel kernel-sessions

Cada bloc de notas o actividad activa en JupyterLab utiliza una sesión del núcleo. Para encontrar todas las sesiones activas, expanda la pestaña Terminales y núcleos en ejecución de la barra lateral izquierda. El tipo y el estado del núcleo de un portátil se pueden identificar observando la parte superior derecha de la interfaz del portátil. En el diagrama siguiente, el núcleo asociado del bloc de notas es Python3 y su estado actual está representado por un círculo gris a la derecha. Un círculo hueco implica un núcleo inactivo y un círculo sólido implica un núcleo ocupado.

Si el núcleo está apagado o inactivo durante un período prolongado, entonces No hay núcleo. se muestra con un círculo sólido. Active un núcleo haciendo clic en el estado del núcleo y seleccionando el tipo de núcleo apropiado como se muestra a continuación:

Lanzador launcher

El lanzador personalizado le proporciona plantillas de bloc de notas útiles para los núcleos compatibles que le ayudarán a iniciar su tarea, entre las que se incluyen:

Plantilla
Descripción
Vacío
Un archivo de bloc de notas vacío.
Starter
Un bloc de notas precargado que muestra la exploración de datos con datos de ejemplo.
Ventas minoristas
Un bloc de notas precargado con la fórmula de venta minorista y datos de ejemplo.
Generador de fórmulas
Plantilla de bloc de notas para crear una fórmula en JupyterLab. Está rellenado previamente con código y comentarios que muestran y describen el proceso de creación de la fórmula. Consulte el bloc de notas para ver el tutorial de fórmulas para obtener un tutorial detallado.
Query Service
Un bloc de notas precargado que muestra el uso de Query Service directamente en JupyterLab con flujos de trabajo de ejemplo proporcionados que analizan los datos a escala.
Eventos de XDM
Un bloc de notas precargado que muestra la exploración de datos en datos de evento de experiencia de valor posterior, centrándose en las funciones comunes en toda la estructura de datos.
Consultas de XDM
Un portátil precargado que muestra ejemplos de consultas empresariales sobre los datos de Experience Event.
Agregación
Un portátil precargado que muestra flujos de trabajo de ejemplo para acumular grandes cantidades de datos en fragmentos más pequeños y manejables.
Clúster
Un bloc de notas precargado que muestra el proceso completo de modelado de aprendizaje automático mediante algoritmos de agrupación en clúster.

Algunas plantillas de bloc de notas están limitadas a determinados núcleos. La disponibilidad de la plantilla para cada núcleo se asigna en la siguiente tabla:

Vacío
Starter
Ventas minoristas
Generador de fórmulas
Query Service
Eventos de XDM
Consultas de XDM
Agregación
Clúster
Python
no
no
no
R
no
no
no
no
no
no
PySpark 3 (Spark 2.4)
no
no
no
no
no
no
Scala
no
no
no
no
no
no

Para abrir un nuevo lanzador, haz clic en Archivo > Nuevo lanzador. También puede expandir Explorador de archivos desde la barra lateral izquierda y hacer clic en el símbolo de suma (+):

Pasos siguientes

Para obtener más información sobre cada uno de los blocs de notas compatibles y cómo utilizarlos, visite la guía para desarrolladores de acceso a datos de los blocs de notas de Jupyterlab. Esta guía se centra en cómo utilizar cuadernos de JupyterLab para acceder a sus datos, incluidos los datos de lectura, escritura y consulta. La guía de acceso a datos también contiene información sobre la cantidad máxima de datos que puede leer cada bloc de notas compatible.

Bibliotecas compatibles supported-libraries

Para obtener una lista de los paquetes admitidos en Python, R y PySpark, copie y pegue !conda list en una celda nueva y, a continuación, ejecute la celda. Una lista de paquetes admitidos se rellena en orden alfabético.

ejemplo

Además, se utilizan las siguientes dependencias, pero no se enumeran:

  • CUDA 11.2
  • CUDNN 8.1
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9