JupyterLab 是基于Web的用户界面,用于 Jupyter项目 并紧密集成到Adobe Experience Platform中。 它为数据科学家提供了交互式开发环境,以便使用Jupyter Notebooks、代码和数据。
本文档提供了以下内容的概述 JupyterLab 及其功能以及执行常见操作的说明。
Experience Platform的JupyterLab集成伴随着体系结构变化、设计注意事项、自定义的笔记本扩展、预安装的库和Adobe主题界面。
下表概述了JupyterLab on Platform的一些独特功能:
功能 | 描述 |
---|---|
内核 | 内核提供笔记本和其他 JupyterLab 前端能够以不同的编程语言执行和检查代码。 Experience Platform 提供了额外的内核来支持中的开发 Python、 R 、 PySpark和 Spark. 请参阅 内核 部分以了解更多详细信息。 |
数据访问 | 直接从访问现有数据集 JupyterLab 完全支持读写功能。 |
Platform服务集成 | 内置的集成允许您利用其他 Platform 内直接提供服务 JupyterLab. 支持的集成的完整列表在以下位置提供: 与其他Platform服务集成. |
身份验证 | 除此之外 JupyterLab的内置安全模型,您的应用程序和Experience Platform之间的每次交互(包括Platform服务到服务通信)都经过加密和身份验证,具体方式为 Adobe Identity Management System (IMS). |
开发库 | In Experience Platform, JupyterLab 提供预安装的库用于 Python、 R和PySpark。 请参阅 附录 以获取支持的库的完整列表。 |
库控制器 | 当预安装的库无法满足您的需求时,可以为Python和R安装其他库,并临时存储在独立的容器中,以保持 Platform 并确保数据安全。 请参阅 内核 部分以了解更多详细信息。 |
其他库仅适用于安装这些库的会话。 在启动新会话时,必须重新安装所需的任何其他库。
标准化和互操作性是背后的关键概念 Experience Platform. 集成 JupyterLab 日期 Platform 作为嵌入式IDE,它允许与其他对象交互 Platform 服务,让您能够利用 Platform 充分发挥它的潜能。 以下各项 Platform 在以下位置提供了服务: JupyterLab:
部分 Platform 上的服务集成 JupyterLab 仅限特定内核。 请参阅以下部分: 内核 了解更多详细信息。
有关的主要功能的信息 JupyterLab 以下各节提供了有关执行常见操作的说明:
In Adobe Experience Platform,选择 Notebooks (从左侧导航列中)。 留出一些时间 JupyterLab 以完全初始化。
此 JupyterLab 界面由一个菜单栏、一个可折叠的左侧边栏和一个包含文档和活动选项卡的主工作区组成。
菜单栏
界面顶部的菜单栏有顶级菜单,其中显示可用的操作 JupyterLab 使用键盘快捷键:
左侧边栏
左侧边栏包含可单击的选项卡,通过这些选项卡可访问以下功能:
选择选项卡以显示其功能,或在展开的选项卡上选择以折叠左侧边栏,如下所示:
主要工作区域
中的主要工作区域 JupyterLab 使您可以将文档和其他活动排列到选项卡面板中,这些面板可以调整大小或进行细分。 将选项卡拖动到选项卡面板的中心以迁移选项卡。 通过将选项卡拖动到面板的左侧、右侧、顶部或底部来划分面板:
In JupyterLab 选择右上角的齿轮图标以打开 笔记本服务器配置. 您可以通过滑块打开GPU并分配所需的内存量。 可分配的内存量取决于您的组织已配置的内存量。 选择 更新配置 以保存。
每个组织只能为笔记本配置一个GPU。 如果GPU正在使用中,则需要等待当前已保留GPU的用户将其释放。 可以通过注销或让GPU处于空闲状态四个小时或更长时间来完成此操作。
In JupyterLab,您可以终止会话以防止其他资源被占用。 首先,选择 电源图标 ,然后选择 关闭 从显示终止会话的弹出窗口。 笔记本会话在12小时不活动后自动终止。
重新启动 JupyterLab,选择 重新启动图标 直接位于电源图标左侧,然后选择 重新启动 从显示的弹出窗口中。
代码单元格是笔记本的主要内容。 它们包含以笔记本相关内核的语言编写的源代码,以及执行代码单元后得到的输出。 每个代码单元格的右侧会显示执行计数,表示其执行顺序。
下面介绍了常见的单元格操作:
添加单元格: 单击加号(+),以添加空单元格。 新单元格放置在当前正在交互的单元格下方,如果没有特定单元格处于焦点位置,则位于笔记本的末尾。
移动单元格: 将光标放在要移动的单元格的右侧,然后单击并将单元格拖动到新位置。 此外,将单元格从一个笔记本移动到另一个笔记本会复制单元格及其内容。
执行单元格: 单击要执行的单元格的正文,然后单击 play 图标(▶)。 星号(*)在内核处理执行时显示在单元格的执行计数器中,并在完成后替换为整数。
删除单元格: 单击要删除的单元格的正文,然后单击 剪刀 图标。
笔记本内核是用于处理笔记本单元格的语言特定计算引擎。 除此之外 Python, JupyterLab 在R、PySpark和 Spark (Scala)。 打开笔记本文档时,将启动关联的内核。 当执行笔记本单元时,内核执行计算并产生可能消耗大量CPU和内存资源的结果。 请注意,在关闭内核之前,不会释放分配的内存。
某些特性和功能仅限于下表所述的特定内核:
内核 | 库安装支持 | Platform 集成 |
---|---|---|
Python | 是 |
|
R | 是 |
|
Scala | 否 |
|
上的每个活动笔记本或活动 JupyterLab 利用内核会话。 通过展开 运行终端和核心 tab键。 通过观察笔记本界面的右上角,可以识别笔记本内核的类型和状态。 在下图中,笔记本的相关内核为 Python3 它的当前状态用右边的灰色圆圈表示。 空心圆表示空闲核,实心圆表示繁忙核。
如果内核关闭或长时间不活动,则 无内核! 显示带实心的圆。 单击内核状态并选择适当的内核类型以激活内核,如下所示:
自定义的 启动器 为支持的内核提供有用的笔记本模板,以帮助您开始任务,包括:
模板 | 描述 |
---|---|
空白 | 空的笔记本文件。 |
起始者 | 一个预填充的笔记本,演示使用示例数据探索数据。 |
零售业 | 预填充的笔记本,其特点是 零售方法 使用示例数据。 |
方法生成器 | 用于在中创建方法的笔记本模板 JupyterLab. 它预先填充了代码和注释,用于演示和描述方法创建过程。 请参阅 笔记本到方法教程 详细介绍。 |
Query Service | 预填充笔记本演示使用 Query Service 直接位于 JupyterLab 提供了大规模分析数据的示例工作流。 |
XDM事件 | 一个预填充的笔记本,演示对后值体验事件数据的数据探索,重点介绍数据结构中的共有功能。 |
XDM查询 | 一个预填充的笔记本,演示有关体验事件数据的示例业务查询。 |
聚合 | 一个预填充的笔记本,演示将大量数据聚合到较小、可管理的块中的示例工作流。 |
聚类 | 一个预填充的笔记本,演示使用聚类算法的端到端机器学习建模过程。 |
某些笔记本模板仅限于某些内核。 下表映射了每个内核的模板可用性:
空白 | 起始者 | 零售业 | 方法生成器 | Query Service | XDM事件 | XDM查询 | 聚合 | 聚类 | |
---|---|---|---|---|---|---|---|---|---|
Python | 是 | 是 | 是 | 是 | 是 | 是 | 否 | 否 | 否 |
R | 是 | 是 | 是 | 否 | 否 | 否 | 否 | 否 | 否 |
PySpark 3 (Spark 2.4) | 否 | 是 | 否 | 否 | 否 | 否 | 是 | 是 | 否 |
Scala | 是 | 是 | 否 | 否 | 否 | 否 | 否 | 否 | 是 |
打开新的 启动器,单击 文件>新建启动器. 或者,展开 文件浏览器 单击左侧的加号(+):
要了解有关每个受支持的笔记本及其使用方式的更多信息,请访问 Jupyterlab notebooks数据访问 开发人员指南。 本指南重点介绍如何使用JupyterLab笔记本访问您的数据,包括读取、写入和查询数据。 数据访问指南还包含有关每个受支持的笔记本可读取的最大数据量的信息。
有关Python、R和PySpark中支持的包列表,请复制并粘贴 !conda list
然后,在新单元格中运行单元格。 按字母顺序填充的支持资源包列表。
此外,还使用了以下依赖项,但未列出: