JupyterLab es una interfaz de usuario basada en web para Júpiter del proyecto y está estrechamente integrado en Adobe Experience Platform. Proporciona un entorno de desarrollo interactivo para que los científicos de datos trabajen con Jupyter Notebooks, código y datos.
Este documento proporciona información general sobre JupyterLab y sus características, así como instrucciones para realizar acciones comunes.
La integración de JupyterLab de Experience Platform se acompaña de cambios de arquitectura, consideraciones de diseño, extensiones de bloc de notas personalizadas, bibliotecas preinstaladas y una interfaz temática de Adobe.
La siguiente lista describe algunas de las funciones exclusivas de JupyterLab en Platform:
Función | Descripción |
---|---|
Kernels | Los kernels proporcionan portátiles y otros JupyterLab front-end de la capacidad de ejecutar e introspect código en diferentes lenguajes de programación. Experience Platform proporciona núcleos adicionales para admitir el desarrollo en Python, R, PySpark y Spark. Consulte la kernels para obtener más información. |
Acceso a datos | Acceda a los conjuntos de datos existentes directamente desde dentro JupyterLab con compatibilidad total con funciones de lectura y escritura. |
Platformintegración de servicios | Las integraciones integradas le permiten utilizar otras Platform servicios directamente desde JupyterLab. En la sección de , encontrará una lista completa de las integraciones compatibles con Integración con otros servicios de Platform. |
Autenticación | Además de Modelo de seguridad integrado de JupyterLab, todas las interacciones entre la aplicación y el Experience Platform, incluida la comunicación de servicio a servicio de Platform, se cifran y autentican a través de la variable Adobe Identity Management System (IMS). |
Bibliotecas de desarrollo | En Experience Platform, JupyterLab proporciona bibliotecas preinstaladas para Python, R y PySpark. Consulte la apéndice para obtener una lista completa de las bibliotecas admitidas. |
Controlador de biblioteca | Cuando faltan las bibliotecas preinstaladas para sus necesidades, se pueden instalar bibliotecas adicionales para Python y R, y se almacenan temporalmente en contenedores aislados para mantener la integridad de Platform y mantenga sus datos seguros. Consulte la kernels para obtener más información. |
Las bibliotecas adicionales solo están disponibles para la sesión en la que se instalaron. Debe volver a instalar las bibliotecas adicionales que necesite al iniciar nuevas sesiones.
La normalización y la interoperabilidad son conceptos clave Experience Platform. La integración de JupyterLab en Platform como un IDE integrado le permite interactuar con otros Platform servicios, permitiéndole utilizar Platform a todo su potencial. Lo siguiente Platform los servicios están disponibles en JupyterLab:
Algunas Platform integraciones de servicio en JupyterLab se limitan a núcleos específicos. Consulte la sección sobre kernels para obtener más información.
Información sobre las características clave de JupyterLab En las secciones siguientes se proporcionan instrucciones sobre la realización de operaciones comunes:
En Adobe Experience Platform, seleccione Portátiles en la columna de navegación izquierda. Permitir un poco de tiempo JupyterLab para inicializar completamente.
La variable JupyterLab La interfaz de consta de una barra de menús, una barra lateral izquierda contraíble y el área de trabajo principal que contiene pestañas de documentos y actividades.
Barra de menú
La barra de menús de la parte superior de la interfaz tiene menús de nivel superior que exponen acciones disponibles en JupyterLab con sus métodos abreviados del teclado:
Barra lateral izquierda
La barra lateral izquierda contiene fichas en las que se puede hacer clic y que proporcionan acceso a las siguientes funciones:
Seleccione una ficha para exponer sus funciones o seleccione en una ficha expandida para contraer la barra lateral izquierda como se muestra a continuación:
Área de trabajo principal
El área de trabajo principal de JupyterLab permite organizar documentos y otras actividades en paneles de pestañas que se pueden cambiar de tamaño o subdividir. Arrastre una pestaña al centro de un panel de pestañas para migrar la pestaña. Para dividir un panel, arrastre una ficha a la izquierda, la derecha, la parte superior o la parte inferior del panel:
En JupyterLab seleccione el icono de engranaje en la esquina superior derecha para abrir Configuración del servidor portátil. Puede activar la GPU y asignar la cantidad de memoria que necesita mediante el control deslizante. La cantidad de memoria que puede asignar depende de cuánto haya proporcionado su organización. Select Actualizar configuraciones para guardar.
Solo se proporciona una GPU por organización para portátiles. Si la GPU está en uso, debe esperar a que el usuario que actualmente ha reservado la GPU la libere. Esto se puede hacer cerrando la sesión o dejando la GPU en estado inactivo durante cuatro o más horas.
En JupyterLab, puede finalizar la sesión para evitar que se utilicen más recursos. Comience por seleccionar la icono de alimentación y, a continuación, seleccione Apagar desde la ventana emergente que aparece para finalizar la sesión. Las sesiones de bloc de notas finalizan automáticamente después de 12 horas sin actividad.
Para reiniciar JupyterLab, seleccione icono reiniciar situado directamente a la izquierda del icono de alimentación, seleccione Restart de la ventana emergente que aparece.
Las celdas de código son el contenido principal de los blocs de notas. Contienen código fuente en el idioma del núcleo asociado al bloc de notas y la salida como resultado de ejecutar la celda de código. Se muestra un recuento de ejecución a la derecha de cada celda de código que representa su orden de ejecución.
A continuación se describen las acciones comunes de las celdas:
Agregue una celda: Haga clic en el símbolo más (+) del menú del bloc de notas para añadir una celda vacía. Las celdas nuevas se colocan debajo de la celda con la que se está interactuando o al final del bloc de notas si no hay ninguna celda en concreto enfocada.
Mover una celda: Sitúe el cursor a la derecha de la celda que desee mover y, a continuación, haga clic y arrastre la celda a una nueva ubicación. Además, al mover una celda de un bloc de notas a otro, se replica la celda junto con su contenido.
Ejecutar una celda: Haga clic en el cuerpo de la celda que desea ejecutar y, a continuación, haga clic en el botón play icono (>) del menú del bloc de notas. Un asterisco (*) se muestra en el contador de ejecución de la celda cuando el núcleo está procesando la ejecución y se reemplaza con un número entero al completarse.
Eliminar una celda: Haga clic en el cuerpo de la celda que desea eliminar y, a continuación, haga clic en el botón tijera icono.
Los núcleos de los portátiles son los motores informáticos específicos del lenguaje para procesar las celdas de los portátiles. Además de Python, JupyterLab proporciona compatibilidad con idiomas adicionales en R, PySpark y Spark (Scala). Cuando abre un documento de bloc de notas, se inicia el núcleo asociado. Cuando se ejecuta una celda de un bloc de notas, el núcleo realiza el cálculo y produce resultados que pueden consumir importantes recursos de CPU y memoria. Tenga en cuenta que la memoria asignada no se libera hasta que se apaga el núcleo.
Algunas funciones y funcionalidades se limitan a núcleos particulares, como se describe en la siguiente tabla:
Núcleo | Compatibilidad con la instalación de bibliotecas | Platform integraciones |
---|---|---|
Python | Sí |
|
R | Sí |
|
Scala | No |
|
Cada bloc de notas o actividad activa en JupyterLab utiliza una sesión del núcleo. Para encontrar todas las sesiones activas, expanda el Terminales y kernels en funcionamiento de la barra lateral izquierda. El tipo y estado del núcleo para un bloc de notas se puede identificar observando la parte superior derecha de la interfaz del bloc de notas. En el diagrama siguiente, el núcleo asociado al bloc de notas es Python3 y su estado actual se representa mediante un círculo gris a la derecha. Un círculo hueco implica un núcleo de ralentí y un círculo sólido implica un núcleo ocupado.
Si el núcleo está apagado o inactivo durante un período prolongado, entonces ¡Sin núcleo! con un círculo sólido se muestra. Active un núcleo haciendo clic en el estado del núcleo y seleccionando el tipo de núcleo apropiado como se muestra a continuación:
El Iniciador le proporciona plantillas de bloc de notas útiles para sus kernels compatibles que le ayudarán a iniciar su tarea, incluidas:
Plantilla | Descripción |
---|---|
En blanco | Un archivo de bloc de notas vacío. |
Inicio | Un bloc de notas precargado que muestra la exploración de datos mediante datos de ejemplo. |
Ventas minoristas | Un bloc de notas precargado que incluye el fórmula de venta minorista uso de datos de ejemplo. |
Generador de fórmulas | Una plantilla de bloc de notas para crear una fórmula en JupyterLab. Está precargada con código y comentarios que muestran y describen el proceso de creación de fórmulas. Consulte la tutorial de bloc de notas a fórmula para obtener una guía detallada. |
Query Service | Un bloc de notas precargado que muestra el uso de Query Service directamente en JupyterLab con flujos de trabajo de ejemplo proporcionados que analizan los datos a escala. |
Eventos XDM | Un bloc de notas precargado que muestra la exploración de datos en datos de Evento de Experiencia después de un valor, centrado en características comunes en la estructura de datos. |
Consultas XDM | Un bloc de notas precargado que muestra consultas empresariales de muestra sobre datos de Experience Event. |
Agregación | Un bloc de notas precargado que muestra flujos de trabajo de ejemplo para acumular grandes cantidades de datos en trozos más pequeños y manejables. |
Clustering | Un bloc de notas precargado que muestra el proceso de modelado completo del aprendizaje automático mediante algoritmos de agrupación en clúster. |
Algunas plantillas de bloc de notas se limitan a ciertos núcleos. La disponibilidad de plantillas para cada núcleo se asigna en la siguiente tabla:
En blanco | Inicio | Ventas minoristas | Generador de fórmulas | Query Service | Eventos XDM | Consultas XDM | Agregación | Clustering | |
---|---|---|---|---|---|---|---|---|---|
Python | sí | sí | sí | sí | sí | sí | no | no | no |
R | sí | sí | sí | no | no | no | no | no | no |
PySpark 3 (Spark 2.4) | no | sí | no | no | no | no | sí | sí | no |
Scala | sí | sí | no | no | no | no | no | no | sí |
Para abrir una nueva Iniciador, haga clic en Archivo > Nuevo iniciador. También puede expandir el Explorador de archivos en la barra lateral izquierda y haga clic en el símbolo más (+):
Para obtener más información sobre cada uno de los blocs de notas admitidos y cómo utilizarlos, visite Acceso a los datos de los portátiles Jupyterlab guía para desarrolladores. Esta guía se centra en cómo utilizar los blocs de notas de JupyterLab para acceder a sus datos, incluyendo lectura, escritura y consulta de datos. La guía de acceso a datos también contiene información sobre la cantidad máxima de datos que puede leer cada bloc de notas compatible.
Para obtener una lista de paquetes compatibles con Python, R y PySpark, copie y pegue !conda list
en una celda nueva, ejecute la celda. Una lista de paquetes compatibles se rellena en orden alfabético.
Además, se utilizan las siguientes dependencias, pero no se enumeran: