JupyterLab UI概述

JupyterLab 是Project Jupyter的基于Web的用户界 面, 与Adobe Experience Platform紧密集成在一起。它为数据科学家提供了一个交互式开发环境,以便与Jupyter Notebooks、代码和数据合作。

本文档概述了JupyterLab及其功能以及执行常见操作的说明。

JupyterLab on Experience Platform

Experience Platform的JupyterLab集成附带体系结构更改、设计注意事项、自定义的笔记本扩展、预安装的库以及以Adobe为主题的界面。

以下列表概述了JupyterLab在Platform上独有的一些功能:

功能 描述
内核 内核提供笔记本和其他JupyterLab前端的功能,以便以不同的编程语言执行和检查代码。 Experience Platform 提供额外的内核,以支 Python持、R、PySpark和中的开 Spark发。有关更多详细信息,请参阅kernel部分。
数据访问 完全支持读写功能,可直接从JupyterLab内访问现有数据集。
Platform服务集成 内置集成允许您直接从JupyterLab内使用其他Platform服务。 与其他Platform服务的集成的部分中提供了受支持集成的完整列表。
身份验证 除了JupyterLab的内置安全模型之外,您的应用程序与Experience Platform(包括平台服务到服务通信)之间的每次交互都通过Adobe Identity Management System (IMS)进行加密和验证。
开发库 在Experience Platform中,JupyterLab为Python、R和PySpark提供预安装的库。 有关支持的库的完整列表,请参阅附录
库控制器 如果您没有预安装的库以满足您的需求,则可以为Python和R安装其他库,并将其临时存储在隔离的容器中,以保持Platform的完整性并保证数据安全。 有关更多详细信息,请参阅kernel部分。
注意

其他库仅可用于安装它们的会话。 启动新会话时,必须重新安装所需的任何其他库。

与其他Platform服务集成

标准化和互操作性是Experience Platform背后的关键概念。 将Platform上的JupyterLab作为嵌入式IDE集成后,它可以与其他Platform服务进行交互,从而使您能够充分利用Platform的潜力。 JupyterLab中提供了以下Platform服务:

  • Catalog Service: 访问和浏览具有读写功能的数据集。
  • Query Service: 使用SQL访问和浏览数据集,在处理大量数据时提供更低的数据访问开销。
  • Sensei ML Framework: 能够进行模型开发,以便训练和评分数据,以及通过单击创建方法。
  • Experience Data Model (XDM): 标准化和互操作性是Adobe Experience Platform背后的关键概念。由Adobe驱动的体验数据模型(XDM),旨在实现客户体验数据的标准化并定义客户体验管理架构。
注意

JupyterLab上的某些Platform服务集成仅限于特定内核。 有关更多详细信息,请参阅kernel上的部分。

主要功能和常见操作

以下各节提供了有关JupyterLab的主要功能以及执行常见操作的说明的信息:

访问 JupyterLab

Adobe Experience Platform中,从左侧导航列中选择​Notebooks。 允许一些时间来完全初始化JupyterLab。

JupyterLab 界面

JupyterLab界面由菜单栏、可折叠的左侧栏以及包含文档和活动选项卡的主工作区组成。

菜单栏

界面顶部的菜单栏具有顶级菜单,用于显示JupyterLab中可用的操作及其键盘快捷键:

  • 文件: 与文件和目录相关的操作
  • 编辑: 与编辑文档和其他活动相关的操作
  • 视图: 更改 JupyterLab
  • 运行: 在不同活动(如笔记本和代码控制台)中运行代码的操作
  • 内核: 用于管理内核的操作
  • 选项卡: 打开的文档和活动的列表
  • 设置: 常用设置和高级设置编辑器
  • 帮助: 和内核 JupyterLab 帮助链接的列表

左侧栏

左侧的侧栏包含可单击的选项卡,这些选项卡提供对以下功能的访问:

  • 文件浏览器: 保存的笔记本文档和目录的列表
  • 数据资源管理器: 浏览、访问和浏览数据集和架构
  • 运行内核和终端: 具有终止能力的活动内核和终端会话列表
  • 命令: 有用命令的列表
  • 单元格检查器: 单元格编辑器,提供对工具和元数据的访问,这些工具和元数据可用于设置用于演示目的的笔记本
  • 选项卡: 打开的选项卡列表

选择一个选项卡以显示其功能,或在展开的选项卡上选择以折叠左侧边栏,如下所示:

主要工作区

JupyterLab中的主要工作区域允许您将文档和其他活动排列到选项卡的面板中,这些选项卡可以调整大小或进行细分。 将选项卡拖动到选项卡面板的中心,以迁移选项卡。 将面板除以向面板的左、右、顶或底部拖动制表符:

Python/R中的GPU和内存服务器配置

在JupyterLab中,选择右上角的齿轮图标以打开​笔记本服务器配置。 您可以打开GPU并使用滑块分配所需的内存量。 您可以分配的内存量取决于贵组织已配置的内存量。 选择​更新配置​以进行保存。

注意

每个组织只为笔记本配置一个GPU。 如果GPU正在使用,则需要等待当前已保留GPU的用户释放该GPU。 这可以通过注销或将GPU保留在空闲状态四小时或更长时间来完成。

终止并重新启动JupyterLab

在JupyterLab中,您可以终止会话以阻止使用其他资源。 首先,选择​电源图标 电源图标,然后从显示为终止会话的弹出窗口中选择​关闭。 笔记本会话在没有活动12小时后自动终止。

要重新启动JupyterLab,请选择位于电源图标左侧的​重新启动图标 重新启动图标,然后从显示的弹出窗口中选择​重新启动

终止jupterlab

代码单元格

代码单元格是笔记本的主要内容。 它们包含以笔记本关联内核的语言和作为执行代码单元结果的输出的源代码。 每个代码单元格的右侧将显示执行计数,该代码单元格表示其执行顺序。

常见单元格操作描述如下:

  • 添加单元格: 单击笔记本菜单中的加号(+)可添加空单元格。新单元格放置在当前正在交互的单元格下,或者如果没有特定单元格处于焦点中,则放置在笔记本的末尾。

  • 移动单元格: 将光标放在要移动的单元格的右侧,然后单击并将单元格拖动到新位置。此外,将单元格从一个笔记本移动到另一个笔记本会复制该单元格及其内容。

  • 执行单元格: 单击要执行的单元格的正文,然后单击笔记本 ​菜单中的播放图标()。内核处理执行时,单元格的执行计数器中会显示星号(*),并在完成后替换为整数。

  • 删除单元格: 单击要删除的单元格的正文,然后单击剪 ​刀图标。

内核

笔记本内核是处理笔记本单元的语言专用计算引擎。 除了Python之外,JupyterLab还在R、PySpark和Spark (Scala)中提供其他语言支持。 打开笔记本文档时,将启动关联的内核。 当执行笔记本单元时,内核执行计算并产生可能消耗大量CPU和内存资源的结果。 请注意,在内核关闭之前,不会释放已分配的内存。

某些特性和功能仅限于下表所述的特定内核:

内核 库安装支持 Platform 集成
Python
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R
  • Sensei ML Framework
  • Catalog Service
斯卡拉
  • Sensei ML Framework
  • Catalog Service

内核会话

JupyterLab上的每个活动笔记本或活动都使用内核会话。 从左侧边栏中展开​运行终端和内核​选项卡,可找到所有活动会话。 可通过观察笔记本界面的右上方来识别笔记本的内核类型和状态。 在下图中,笔记本的关联内核为​Python3,其当前状态由右侧的灰色圆表示。 空心圆表示空闲内核,实心圆表示忙内核。

如果内核已关闭或处于非活动状态一段时间,则​无内核! 显示实心圆。通过单击内核状态并选择相应的内核类型来激活内核,如下所示:

启动器

自定义的​启动器​为支持的内核提供了有用的笔记本模板,以帮助您启动任务,包括:

模板 描述
空白 空的笔记本文件。
入门 预填充的笔记本演示使用示例数据进行数据探索。
零售销售 使用示例数据显示零售销售方法的预填充笔记本。
方法生成器 用于在JupyterLab中创建方法的笔记本模板。 它预填充了用于演示和描述方法创建过程的代码和评注。 有关详细的演练,请参阅笔记本到方法教程
Query Service 预填充的笔记本,直接在JupyterLab中显示Query Service的用法,并提供了分析大规模数据的示例工作流。
XDM事件 预填充的笔记本,展示了关于后值体验事件数据的数据探索,重点介绍整个数据结构中通用的功能。
XDM查询 一个预填充的笔记本,用于演示有关Experience Event数据的示例业务查询。
聚合 预填充的笔记本,展示了将大量数据聚合为更小、可管理的块的示例工作流。
聚类 一种预填充的笔记本,用于演示使用聚类算法的端到端机器学习建模过程。

某些笔记本模板仅限于某些内核。 下表映射了每个内核的模板可用性:

空白 入门 零售销售 方法生成器 Query Service XDM事件 XDM查询 聚合 聚类
Python
R
PySpark 3(Spark 2.4)
斯卡拉

要打开新的​启动器,请单击​文件>新建启动器。 或者,从左侧边栏中展开​文件浏览器,然后单击加号(+):

后续步骤

要进一步了解每个受支持的笔记本及其使用方法,请访问Jupyterlab笔记本数据访问开发人员指南。 本指南重点介绍如何使用JupyterLab笔记本访问数据,包括读取、写入和查询数据。 数据访问指南还包含有关每个受支持的笔记本可读取的最大数据量的信息。

支持的库

有关Python、R和PySpark中支持的包列表,请在新单元格中复制并粘贴!conda list,然后运行该单元格。 按字母顺序填充受支持包的列表。

示例

此外,还使用了以下依赖项,但未列出这些依赖项:

  • CUDA 11.2
  • CUDNN 8.1

在此页面上