JupyterLab Información general de IU

NOTE
La Espacio de trabajo de ciencia de datos ya no está disponible para su compra.
Esta documentación está destinada a clientes existentes con derechos previos a Data Science Espacio de trabajo.

JupyterLab es una interfaz de usuario basada en web para Project Jupyter y está estrechamente integrada en Adobe Experience Platform. Proporciona un entorno de desarrollo interactivo para que los científicos de datos trabajen con Jupyter Notebooks, código y datos.

Este documento proporciona información general de JupyterLab sus funciones, así como instrucciones para realizar acciones comunes.

JupyterLab en Experience Platform

La integración de JupyterLab de Experience Platform se acompaña de cambios arquitectónicos, consideraciones de diseño, extensiones de bloc de notas personalizadas, bibliotecas preinstalados y una interfaz con temas de Adobe Systems.

La siguiente lista describe algunas de las características exclusivas de JupyterLab en Platform:

Función
Descripción
Núcleos
Los kernels proporcionan a los cuadernos y otros JupyterLab front-ends la capacidad de ejecutar e introspección de código en diferentes lenguajes de programación. Experience Platform proporciona kernels adicionales para admitir el desarrollo en Python, R, PySpark y Spark. Consulte la sección kernels para obtener más detalles.
Acceso a datos
Obtenga acceso a los conjuntos de datos existentes directamente desde JupyterLab, con compatibilidad total con las capacidades de lectura y escritura.
Platformintegración de servicio
Las integraciones integradas le permiten utilizar otros servicios de Platform directamente desde JupyterLab. Se proporciona una lista completa de las integraciones compatibles en la sección sobre Integración con otros servicios de Platform.
Autenticación
Además del modelo de seguridad integrado de JupyterLab, todas las interacciones entre su aplicación y el Experience Platform, incluida la comunicación de servicio a servicio de Platform, se cifran y se autentican mediante Adobe Identity Management System (IMS).
Bibliotecas de desarrollo
En Experience Platform, JupyterLab proporciona bibliotecas preinstaladas para Python, R y PySpark. Consulte el apéndice para obtener una lista completa de las bibliotecas admitidas.
Controlador de biblioteca
Cuando faltan los bibliotecas preinstalados para sus necesidades, se pueden instalar bibliotecas adicionales para Python y R, y se almacenan temporalmente en contenedores aislados para mantener la integridad y Platform mantener sus datos seguros. Consulte la sección kernels para obtener más información.
NOTE
Las bibliotecas adicionales solo están disponibles para la sesión en la que se instalaron. Debe volver a instalar las bibliotecas adicionales que necesite al iniciar nuevas sesiones.

Integración con otros Platform servicios service-integration

La estandarización y la interoperabilidad son conceptos clave detrás de Experience Platform. La integración de JupyterLab en Platform como IDE incrustado le permite interactuar con otros servicios de Platform, lo que le permite utilizar Platform todo su potencial. Los siguientes Platform servicios están disponibles en JupyterLab:

  • Catalog Service: Acceda a conjuntos de datos y explórelos con funcionalidades de lectura y escritura.
  • Query Service: Acceda y explore conjuntos de datos mediante SQL, lo que proporciona una menor sobrecarga de acceso a los datos cuando se trata de grandes cantidades de datos.
  • Sensei ML Framework: Desarrollo de modelos con la capacidad de entrenar y puntuar datos, así como fórmula creación con un solo clic.
  • Experience Data Model (XDM): La estandarización y la interoperabilidad son conceptos clave detrás de Adobe Experience Platform. El Modelo de datos de experiencia (XDM), impulsado por Adobe Systems, es un esfuerzo para estandarizar experiencia del cliente datos y definir esquemas para administración de experiencias del cliente.
NOTE
Algunas Platform integraciones de servicios están JupyterLab limitadas a kernels específicos. Consulte la sección sobre kernels para obtener más detalles.

Características clave y operaciones comunes

En las secciones siguientes se proporciona información sobre las características clave y las instrucciones sobre la realización de JupyterLab operaciones comunes:

Acceder a JupyterLab access-jupyterlab

En Adobe Experience Platform, seleccione Notebooks de la columna de navegación izquierda. Espere un tiempo para que JupyterLab se inicialice por completo.

JupyterLab interfaz jupyterlab-interface

La JupyterLab interfaz consta de una barra de menú, una barra lateral izquierda plegable y el área de trabajo principal que contiene pestañas de documentos y actividades.

Barra de menús

La barra de menús en la parte superior de la interfaz tiene menús de nivel superior que exponen las acciones disponibles en JupyterLab con sus métodos abreviados de teclado:

  • Archivo: Acciones relacionadas con archivos y directorios
  • Editar: Acciones relacionadas con la edición de documentos y otras actividades
  • Ver: Acciones que alteran el aspecto de JupyterLab
  • Ejecutar: acciones para ejecutar código en diferentes actividades, como blocs de notas y consolas de código.
  • Kernel: Acciones para administrar kernels
  • Fichas: Una lista de documentos y actividades abiertos
  • Configuración: Configuración común y un editor de configuración avanzada
  • Ayuda: Una lista de JupyterLab y vínculos de ayuda del núcleo

Barra lateral izquierda

La barra lateral izquierda contiene pestañas en las que se puede hacer clic y que proporcionan acceso a las siguientes funciones:

  • Archivo explorador: lista de documentos y directorios de blocs de notas guardados
  • Explorador de datos: Examinar, acceda y explore conjuntos de datos y esquemas
  • Ejecución de kernels y terminales: Un lista de sesiones activas de kernel y terminal con la capacidad de terminar
  • Comandos: lista de comandos útiles
  • Inspector de celdas: editor de celda que proporciona acceso a herramientas y metadatos útiles para configurar un bloc de notas con fines de presentación.
  • pestañas: lista de pestañas abiertas

Seleccione una pestaña para exponer sus funciones, o seleccione en un pestaña expandido contraer la barra lateral izquierda como se muestra a continuación:

Área de trabajo principal

El área de trabajo principal le JupyterLab permite organizar documentos y otras actividades en paneles de pestañas que se pueden cambiar de tamaño o subdividir. Arrastre un pestaña al centro de un panel de pestaña para migrar el pestaña. Para dividir un panel, arrastre un pestaña a la izquierda, derecha, parte superior o inferior del panel:

Configuración de GPU y servidor de memoria en Python/R

En JupyterLab ella, seleccione el icono de engranaje en la esquina superior derecha para abrir la configuración del servidor Notebook. Puede activar la GPU y asignar la cantidad de memoria que necesite mediante el control deslizante. La cantidad de memoria que puede asignar depende de la cantidad que haya aprovisionado su organización. Seleccione Actualizar configuraciones para guardar.

NOTE
Solo se proporciona una GPU por organización para Notebooks. Si la GPU está en uso, tendrá que esperar a que la libere el usuario que la ha reservado actualmente. Esto se puede hacer cerrando la sesión o dejando la GPU en estado inactivo durante cuatro horas o más.

Terminar y reiniciar JupyterLab

En JupyterLab, puede finalizar su sesión para evitar que se usen más recursos. Comience por seleccionar el icono de energía icono de energía y, a continuación, seleccione Apagar de la ventana emergente que aparece para finalizar su sesión. Las sesiones de Notebook finalizan automáticamente después de 12 horas de inactividad.

Para reiniciar JupyterLab, selecciona el icono de reinicio icono de reinicio que se encuentra directamente a la izquierda del icono de encendido y, a continuación, selecciona Reiniciar de la ventana emergente que aparece.

finalizar jupyterlab

Celdas de código code-cells

Las celdas de código son el contenido principal de los blocs de notas. Contienen código fuente en el idioma del núcleo asociado del bloc de notas y la salida como resultado de la ejecución de la celda de código. Se muestra un recuento de ejecución a la derecha de cada celda de código que representa su orden de ejecución.

A continuación se describen las acciones de celda comunes:

  • Agregar una celda: Haga clic en el símbolo más (+) del menú del bloc de notas para agregar una celda vacía. Las nuevas celdas se colocan debajo de la celda con la que se está interactuando actualmente, o al final del bloc de notas si no hay ninguna celda en particular enfocada.

  • Mover una celda: Coloque el cursor a la derecha de la celda que desea mover y, a continuación, haga clic y arrastre la celda a una nueva ubicación. Además, al mover una celda de un bloc de notas a otro se replica la celda junto con su contenido.

  • Ejecutar una celda: Haga clic en el cuerpo de la celda que desea ejecutar y, a continuación, haga clic en el icono reproducir () del menú del bloc de notas. Se muestra un asterisco (*) en el contador de ejecución de la celda cuando el núcleo está procesando la ejecución y se reemplaza con un entero al finalizar.

  • Eliminar una celda: Haga clic en el cuerpo de la celda que desea eliminar y, a continuación, haga clic en el icono tijera.

Núcleos kernels

Los núcleos de los portátiles son los motores informáticos específicos del idioma para el procesamiento de las celdas de los portátiles. Además de Python, JupyterLab proporciona compatibilidad con idiomas adicional en R, PySpark y Spark (Scala). Al abrir un documento de bloc de notas, se inicia el núcleo asociado. Cuando se ejecuta una celda de un bloc de notas, el núcleo realiza el cálculo y produce resultados que pueden consumir recursos significativos de CPU y memoria. Tenga en cuenta que la memoria asignada no se libera hasta que se apaga el núcleo.

Ciertas características y funcionalidades están limitadas a núcleos particulares como se describe en la tabla siguiente:

Núcleo
Compatibilidad con instalación de biblioteca
Integraciones de Platform
Python
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R
  • Sensei ML Framework
  • Catalog Service
Scala
No
  • Sensei ML Framework
  • Catalog Service

Sesiones de kernel kernel-sessions

Cada bloc de notas o actividad activa en JupyterLab utiliza una sesión del núcleo. Para encontrar todas las sesiones activas, expanda la pestaña Terminales y núcleos en ejecución de la barra lateral izquierda. El tipo y el estado del núcleo de un portátil se pueden identificar observando la parte superior derecha de la interfaz del portátil. En el diagrama siguiente, el núcleo asociado del bloc de notas es Python3 y su estado actual está representado por un círculo gris a la derecha. Un círculo hueco implica un núcleo inactivo y un círculo sólido implica un núcleo ocupado.

Si el kernel está apagado o inactivo durante un período prolongado, entonces ¡No Kernel! con un círculo sólido se muestra. Active un kernel haciendo clic en el estado del kernel y seleccionando el tipo de kernel apropiado como se muestra a continuación:

Lanzadera launcher

El lanzador personalizado le proporciona plantillas de bloc de notas útiles para sus kernels compatibles con el fin de ayudarle a poner en marcha su tarea, incluyendo:

Plantilla
Descripción
Espacio en blanco
Un archivo de bloc de notas vacío.
Iniciador
Un bloc de notas precargado que muestra la exploración de datos con datos de ejemplo.
Ventas minoristas
Un bloc de notas precargado con la fórmula de venta minorista y datos de ejemplo.
Generador de recetas
Un bloc de notas plantilla para crear un fórmula en JupyterLab. Está precargado con código y comentarios que demuestran y describen el proceso de creación de fórmula. Consulte el bloc de notas para obtener fórmula tutorial un recorrido detallado.
Query Service
Un cuaderno precargado que demuestra el uso de Query Service directamente con JupyterLab el flujos de trabajo de muestra proporcionado que analiza los datos a escala.
Eventos XDM
Un bloc de notas precargado que muestra la exploración de datos en datos de eventos de experiencia posvalor, centrándose en las características comunes en toda la estructura de datos.
Consultas XDM
Un bloc de notas rellenado previamente que muestra consultas comerciales de muestra sobre datos de eventos de experiencia.
Agregación
Un cuaderno precargado que muestra flujos de trabajo de muestra para agregado grandes cantidades de datos en trozos más pequeños y manejables.
Agrupamiento
Un bloc de notas precargado que muestra el proceso de modelado de aprendizaje automático de extremo a extremo mediante algoritmos de agrupación en clústeres.

Algunas plantillas de bloc de notas están limitadas a determinados núcleos. La disponibilidad de plantillas para cada kernel se asigna en la tabla siguiente:

Vacío
Starter
Ventas minoristas
Generador de fórmulas
Query Service
Eventos de XDM
Consultas de XDM
Agregación
Agrupamiento
Python
no
no
no
R
no
no
no
no
no
no
PySpark 3 (Spark 2.4)
no
no
no
no
no
no
Scala
no
no
no
no
no
no

Para abrir un nuevo iniciador, haga clic en Archivo > Nuevo iniciador. También puede expandir Explorador de archivos desde la barra lateral izquierda y hacer clic en el símbolo de suma (+):

Pasos siguientes

Para obtener más información sobre cada uno de los blocs de notas compatibles y cómo usarlos, visita el guía del desarrollador de acceso a datos de blocs de notas de Jupyterlab. Este guía se centra en cómo usar los blocs de notas de JupyterLab para acceder a los datos, incluidos los datos de lectura, escritura y consulta. La guía de acceso a datos también contiene información sobre la cantidad máxima de datos que puede leer cada bloc de notas compatible.

bibliotecas admitido supported-libraries

Para obtener una lista de paquetes compatibles con Python, R y PySpark, copie y pegue !conda list en una nueva celda y, a continuación, ejecute la celda. La lista de paquetes admitidos se rellena en orden alfabético.

ejemplo

Además, se usan las siguientes dependencias, pero no se enumeran:

  • CUDA 11.2
  • CUDNN 8.1
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9