JupyterLab UI 概述
JupyterLab是Project Jupyter的基于Web的用户界面,已紧密集成到Adobe Experience Platform中。 它为数据科学家提供了交互式开发环境,以便使用Jupyter Notebooks、代码和数据。
本文档概述了JupyterLab及其功能,并提供了执行常见操作的说明。
Experience Platform上的JupyterLab
Experience Platform的JupyterLab集成伴随着体系结构变化、设计注意事项、自定义笔记本扩展、预安装的库和Adobe主题化界面。
以下列表概述了JupyterLab在平台上独有的一些功能:
与其他Platform服务集成 service-integration
标准化和互操作性是Experience Platform背后的关键概念。 将JupyterLab作为嵌入式IDE集成到Platform上后,可以与其他Platform服务进行交互,从而使您能够充分利用Platform。 以下Platform服务在JupyterLab中可用:
- Catalog Service: 访问和浏览具有读写功能的数据集。
- Query Service: 使用SQL访问和浏览数据集,在处理大量数据时提供较低的数据访问开销。
- Sensei ML Framework: 模型开发,能够训练数据和为数据评分,以及通过一次单击即可创建方法。
- Experience Data Model (XDM): 标准化和互操作性是Adobe Experience Platform背后的关键概念。 体验数据模型(XDM)由Adobe驱动,用于标准化客户体验数据和定义客户体验管理的架构。
主要功能和常见操作
以下各节提供了有关JupyterLab的主要功能的信息以及执行常见操作的说明:
访问JupyterLab access-jupyterlab
在Adobe Experience Platform中,从左侧导航列中选择 笔记本。 留出一段时间让JupyterLab完全初始化。
JupyterLab接口 jupyterlab-interface
JupyterLab界面由菜单栏、可折叠的左侧边栏以及包含文档和活动选项卡的主工作区组成。
菜单栏
界面顶部的菜单栏有顶级菜单,这些菜单显示JupyterLab中可用的操作及其键盘快捷键:
- 文件: 与文件和目录相关的操作
- 编辑: 与编辑文档和其他活动相关的操作
- 视图: 改变JupyterLab外观的操作
- 运行: 用于在不同的活动(如笔记本和代码控制台)中运行代码的操作
- 内核: 用于管理内核的操作
- 选项卡: 打开的文档和活动的列表
- 设置: 常用设置和高级设置编辑器
- 帮助: JupyterLab和内核帮助链接的列表
左侧栏
左侧边栏包含可单击的选项卡,通过这些选项卡可访问以下功能:
- 文件浏览器: 已保存笔记本文档和目录的列表
- 数据资源管理器: 浏览、访问和浏览数据集和架构
- 正在运行内核和终端: 能够终止的活动内核和终端会话列表
- 命令: 有用的命令列表
- 单元格检查器: 单元格编辑器,用于访问可用于设置笔记本以进行演示的工具和元数据
- 选项卡: 打开的选项卡列表
选择选项卡以显示其功能,或在展开的选项卡上选择以折叠左侧边栏,如下所示:
主工作区
JupyterLab中的主工作区允许您将文档和其他活动排列到选项卡面板中,这些面板可以调整大小或进行细分。 将选项卡拖到选项卡面板的中心以迁移选项卡。 通过将选项卡拖到面板的左侧、右侧、顶部或底部来划分面板:
Python/R中的GPU和内存服务器配置
在JupyterLab中,选择右上角的齿轮图标以打开 笔记本服务器配置。 您可以通过滑块打开GPU并分配所需的内存量。 可分配的内存量取决于您的组织已配置的内存量。 选择 更新配置 以进行保存。
终止并重新启动JupyterLab
在JupyterLab中,您可以终止会话以防止使用其他资源。 首先选择 电源图标 ,然后从似乎将终止会话的弹出框中选择 关闭。 笔记本会话在12小时不活动后自动终止。
若要重新启动JupyterLab,请选择电源图标左边的 重新启动图标 ,然后从显示的弹出框中选择 重新启动。
编码单元格 code-cells
代码单元格是笔记本的主要内容。 它们包含以笔记本关联内核的语言编写的源代码,以及执行代码单元后的输出。 执行计数显示在每个代码单元格的右侧,表示其执行顺序。
下面介绍了常见的单元格操作:
-
添加单元格: 单击笔记本菜单中的加号(+)可添加空单元格。 新单元格被放置在当前正在交互的单元格下方,如果没有特定单元格处于焦点位置,则位于笔记本的末尾。
-
移动单元格: 将光标放在要移动的单元格的右侧,然后单击并将单元格拖到新位置。 此外,将单元格从一个笔记本移动到另一个笔记本会复制该单元格及其内容。
-
执行单元格: 单击要执行的单元格正文,然后单击笔记本菜单中的 播放 图标(▶)。 当内核正在处理执行时,单元格的执行计数器中会显示一个星号(*),完成时该星号会被替换为整数。
-
删除单元格: 单击要删除单元格的正文,然后单击 剪刀 图标。
内核 kernels
笔记本内核是用于处理笔记本电池的语言特定计算引擎。 除了Python之外,JupyterLab还在R、PySpark和Spark (Scala)中提供其他语言支持。 打开笔记本文档时,会启动关联的内核。 当执行笔记本单元时,内核执行计算并产生可能消耗大量CPU和内存资源的结果。 请注意,在关闭内核之前,不会释放分配的内存。
某些特性和功能仅限于下表所述的特定内核:
- Sensei ML Framework
- Catalog Service
- Query Service
- Sensei ML Framework
- Catalog Service
- Sensei ML Framework
- Catalog Service
内核会话 kernel-sessions
JupyterLab上的每个活动笔记本或活动都使用内核会话。 通过展开左侧边栏中的 正在运行的终端和内核 选项卡,可以找到所有活动会话。 通过观察笔记本界面的右上角,可以识别笔记本内核的类型和状态。 在下图中,笔记本的关联内核为 Python3,其当前状态由右侧的灰色圆圈表示。 空心圆表示空闲内核,实心圆表示繁忙内核。
如果内核关闭或长时间处于非活动状态,则 无内核!显示带实心圆的。 单击内核状态并选择适当的内核类型来激活内核,如下所示:
启动器 launcher
自定义的 启动器 可为支持的内核提供有用的笔记本模板,以帮助您启动任务,包括:
某些笔记本模板仅限于某些内核。 每个内核的模板可用性如下表所示:
要打开新的 启动器,请单击 文件>新建启动器。 或者,从左侧边栏展开 文件浏览器,然后单击加号(+):
后续步骤
要了解有关每个受支持的笔记本及其使用方法的更多信息,请访问Jupyterlab notebooks数据访问开发人员指南。 本指南重点介绍如何使用JupyterLab笔记本访问您的数据,包括读取、写入和查询数据。 数据访问指南还包含有关每个受支持的笔记本可读取的最大数据量的信息。
支持的库 supported-libraries
要获取Python、R和PySpark中支持的包列表,请将!conda list
复制并粘贴到新单元格中,然后运行该单元格。 系统按字母顺序填充了受支持的资源包列表。
此外,还使用了下列依赖项,但未列出:
- CUDA 11.2
- CUDNN 8.1