JupyterLab es una interfaz de usuario basada en web para Proyecto Jupyter y está totalmente integrado en Adobe Experience Platform. Proporciona un entorno de desarrollo interactivo para que los científicos de datos trabajen con Jupyter Notebooks, código y datos.
Este documento proporciona información general sobre JupyterLab y sus características, así como instrucciones para realizar acciones comunes.
La integración de JupyterLab de Experience Platform se acompaña de cambios arquitectónicos, consideraciones de diseño, extensiones de portátiles personalizadas, bibliotecas preinstaladas y una interfaz temática de Adobe.
La siguiente lista describe algunas de las funciones exclusivas de JupyterLab en Platform:
Función | Descripción |
---|---|
Núcleos | Los núcleos proporcionan cuaderno y otros JupyterLab front-end permite ejecutar e inspeccionar código en diferentes lenguajes de programación. Experience Platform proporciona núcleos adicionales para apoyar el desarrollo en Python, R, PySpark y Spark. Consulte la granos para obtener más información. |
Acceso a datos | Acceder a conjuntos de datos existentes directamente desde JupyterLab con compatibilidad total con las funciones de lectura y escritura. |
Platformintegración de servicios | Las integraciones integradas le permiten utilizar otras Platform servicios directamente desde JupyterLab. En la sección sobre, encontrará una lista completa de las integraciones compatibles Integración con otros servicios de Platform. |
Autenticación | Además de El modelo de seguridad integrado de JupyterLab, todas las interacciones entre la aplicación y el Experience Platform, incluida la comunicación entre servicios de Platform, se cifran y autentican a través de Adobe Identity Management System (IMS). |
Bibliotecas de desarrollo | Entrada Experience Platform, JupyterLab proporciona bibliotecas preinstaladas para Python, R y PySpark. Consulte la apéndice para obtener una lista completa de las bibliotecas compatibles. |
Controlador de biblioteca | Cuando faltan las bibliotecas preinstaladas para sus necesidades, se pueden instalar bibliotecas adicionales para Python y R, y se almacenan temporalmente en contenedores aislados para mantener la integridad de Platform y mantenga sus datos seguros. Consulte la granos para obtener más información. |
Las bibliotecas adicionales solo están disponibles para la sesión en la que se instalaron. Debe volver a instalar las bibliotecas adicionales que necesite al iniciar nuevas sesiones.
La estandarización y la interoperabilidad son conceptos clave Experience Platform. La integración de JupyterLab el Platform como IDE incrustado le permite interactuar con otros Platform servicios, lo que le permite utilizar Platform a todo su potencial. Lo siguiente Platform Los servicios de están disponibles en JupyterLab:
Algunos Platform integraciones de servicio en JupyterLab se limitan a núcleos específicos. Consulte la sección sobre granos para obtener más información.
Información sobre las características principales de JupyterLab En las siguientes secciones se proporcionan instrucciones e instrucciones para realizar operaciones comunes:
Entrada Adobe Experience Platform, seleccione Notebooks en la columna de navegación izquierda. Espere un poco JupyterLab para inicializar completamente.
El JupyterLab La interfaz de consta de una barra de menús, una barra lateral izquierda contraíble y el área de trabajo principal que contiene pestañas de documentos y actividades.
Barra de menú
La barra de menús de la parte superior de la interfaz tiene menús de nivel superior que exponen acciones disponibles en JupyterLab con sus métodos abreviados del teclado:
Barra lateral izquierda
La barra lateral izquierda contiene pestañas en las que se puede hacer clic y que proporcionan acceso a las siguientes funciones:
Seleccione una pestaña para exponer sus funciones o seleccione en una pestaña expandida para contraer la barra lateral izquierda como se muestra a continuación:
Área de trabajo principal
El área de trabajo principal en JupyterLab permite organizar documentos y otras actividades en paneles de pestañas que se pueden cambiar de tamaño o subdividir. Arrastre una pestaña al centro de un panel de pestañas para migrar la pestaña. Divida un panel arrastrando una pestaña a la izquierda, a la derecha, a la parte superior o a la parte inferior del panel:
Entrada JupyterLab seleccione el icono de engranaje en la esquina superior derecha para abrirlo Configuración del servidor de portátiles. Puede activar la GPU y asignar la cantidad de memoria que necesite mediante el control deslizante. La cantidad de memoria que puede asignar depende de la cantidad que haya aprovisionado su organización. Seleccionar Actualizar configuraciones para guardar.
Solo se proporciona una GPU por organización para Notebooks. Si la GPU está en uso, tendrá que esperar a que la libere el usuario que la ha reservado actualmente. Esto se puede hacer cerrando la sesión o dejando la GPU en estado inactivo durante cuatro horas o más.
Entrada JupyterLab, puede finalizar la sesión para evitar que se utilicen más recursos. Comience por seleccionar la icono de energía , luego seleccione Apagar desde la ventana emergente que parece finalizar la sesión. Las sesiones de Notebook finalizan automáticamente después de 12 horas de inactividad.
Para reiniciar JupyterLab, seleccione la icono de reinicio situado directamente a la izquierda del icono de encendido, y seleccione Restart desde la ventana emergente que aparece.
Las celdas de código son el contenido principal de los blocs de notas. Contienen código fuente en el idioma del núcleo asociado del bloc de notas y la salida como resultado de la ejecución de la celda de código. Se muestra un recuento de ejecución a la derecha de cada celda de código que representa su orden de ejecución.
Las acciones celulares comunes se describen a continuación:
Agregar una celda: Haga clic en el símbolo más (+) en el menú del bloc de notas para agregar una celda vacía. Las nuevas celdas se colocan debajo de la celda con la que se está interactuando actualmente, o al final del bloc de notas si no hay ninguna celda en particular enfocada.
Mover una celda: Coloque el cursor a la derecha de la celda que desea mover y, a continuación, haga clic en la celda y arrástrela a una nueva ubicación. Además, al mover una celda de un bloc de notas a otro se replica la celda junto con su contenido.
Ejecutar una celda: Haga clic en el cuerpo de la celda que desea ejecutar y luego haga clic en el botón play icono (▶) en el menú del bloc de notas. Un asterisco (*) se muestra en el contador de ejecución de la celda cuando el núcleo está procesando la ejecución y se reemplaza por un entero al finalizar.
Eliminar una celda: Haga clic en el cuerpo de la celda que desea eliminar y, a continuación, haga clic en el botón tijera icono.
Los núcleos de los portátiles son los motores informáticos específicos del idioma para el procesamiento de las celdas de los portátiles. Además de Python, JupyterLab proporciona compatibilidad adicional con idiomas en R, PySpark y Spark (Scala). Al abrir un documento de bloc de notas, se inicia el núcleo asociado. Cuando se ejecuta una celda de un bloc de notas, el núcleo realiza el cálculo y produce resultados que pueden consumir recursos significativos de CPU y memoria. Tenga en cuenta que la memoria asignada no se libera hasta que se apaga el núcleo.
Ciertas características y funcionalidades están limitadas a núcleos particulares como se describe en la tabla siguiente:
Núcleo | Compatibilidad con instalación de biblioteca | Platform integraciones |
---|---|---|
Python | Sí |
|
R | Sí |
|
Scala | No |
|
Cada bloc de notas o actividad activa en JupyterLab utiliza una sesión del núcleo. Todas las sesiones activas se pueden encontrar ampliando el Terminales y núcleos en funcionamiento de la barra lateral izquierda. El tipo y el estado del núcleo de un portátil se pueden identificar observando la parte superior derecha de la interfaz del portátil. En el diagrama siguiente, el núcleo asociado del bloc de notas es Python3 y su estado actual se representa mediante un círculo gris a la derecha. Un círculo hueco implica un núcleo inactivo y un círculo sólido implica un núcleo ocupado.
Si el núcleo está apagado o inactivo durante un periodo prolongado, entonces ¡No hay kernel! se muestra con un círculo sólido. Active un núcleo haciendo clic en el estado del núcleo y seleccionando el tipo de núcleo apropiado como se muestra a continuación:
El personalizado Lanzador le proporciona plantillas de bloc de notas útiles para sus núcleos compatibles que le ayudarán a iniciar su tarea, entre las que se incluyen:
Plantilla | Descripción |
---|---|
En blanco | Un archivo de bloc de notas vacío. |
Starter | Un bloc de notas precargado que muestra la exploración de datos con datos de ejemplo. |
Ventas minoristas | Un portátil precargado con la fórmula de venta al por menor uso de datos de ejemplo. |
Generador de fórmulas | Una plantilla de bloc de notas para crear una fórmula en JupyterLab. Está rellenado previamente con código y comentarios que muestran y describen el proceso de creación de la fórmula. Consulte la tutorial de bloc de notas a fórmula para obtener una introducción detallada. |
Query Service | Un portátil precargado que muestra el uso de Query Service directamente en JupyterLab con flujos de trabajo de muestra proporcionados que analizan datos a escala. |
Eventos de XDM | Un bloc de notas precargado que muestra la exploración de datos en datos de evento de experiencia de valor posterior, centrándose en las funciones comunes en toda la estructura de datos. |
Consultas de XDM | Un portátil precargado que muestra ejemplos de consultas empresariales sobre los datos de Experience Event. |
Agregación | Un portátil precargado que muestra flujos de trabajo de ejemplo para acumular grandes cantidades de datos en fragmentos más pequeños y manejables. |
Clustering | Un bloc de notas precargado que muestra el proceso completo de modelado de aprendizaje automático mediante algoritmos de agrupación en clúster. |
Algunas plantillas de bloc de notas están limitadas a determinados núcleos. La disponibilidad de la plantilla para cada núcleo se asigna en la siguiente tabla:
En blanco | Starter | Ventas minoristas | Generador de fórmulas | Query Service | Eventos de XDM | Consultas de XDM | Agregación | Clustering | |
---|---|---|---|---|---|---|---|---|---|
Python | sí | sí | sí | sí | sí | sí | no | no | no |
R | sí | sí | sí | no | no | no | no | no | no |
PySpark 3 (Spark 2,4) | no | sí | no | no | no | no | sí | sí | no |
Scala | sí | sí | no | no | no | no | no | no | sí |
Para abrir un nuevo Lanzador, haga clic en Archivo > Nuevo lanzador. Como alternativa, expanda el Explorador de archivos en la barra lateral izquierda y haga clic en el símbolo más (+):
Para obtener más información sobre cada uno de los portátiles compatibles y cómo utilizarlos, visite el Acceso a datos de portátiles Jupyterlab guía para desarrolladores. Esta guía se centra en cómo utilizar cuadernos de JupyterLab para acceder a sus datos, incluidos los datos de lectura, escritura y consulta. La guía de acceso a datos también contiene información sobre la cantidad máxima de datos que puede leer cada bloc de notas compatible.
Para obtener una lista de los paquetes compatibles en Python, R y PySpark, copie y pegue !conda list
en una celda nueva y, a continuación, ejecute la celda. Una lista de paquetes admitidos se rellena en orden alfabético.
Además, se utilizan las siguientes dependencias, pero no se enumeran: