JupyterLab UI 概述

NOTE
Data Science Workspace不再可购买。
本文档面向之前有权访问数据科学Workspace的现有客户。

JupyterLab是Project Jupyter的基于Web的用户界面,已紧密集成到Adobe Experience Platform中。 它为数据科学家提供了交互式开发环境,以便使用Jupyter Notebooks、代码和数据。

本文档概述了JupyterLab及其功能,并提供了执行常见操作的说明。

Experience Platform上的JupyterLab

Experience Platform的JupyterLab集成伴随着体系结构变化、设计注意事项、自定义笔记本扩展、预安装的库和Adobe主题化界面。

以下列表概述了JupyterLab在平台上独有的一些功能:

功能
描述
内核
内核提供笔记本和其他JupyterLab前端以不同编程语言执行和内部检查代码的功能。 Experience Platform提供了额外的内核以支持Python、R、PySpark和Spark中的开发。 有关更多详细信息,请参阅内核部分。
数据访问
直接从JupyterLab中访问现有数据集,完全支持读取和写入功能。
Platform服务集成
内置集成允许您直接从JupyterLab中利用其他Platform服务。 在与其他Platform服务的集成部分中,提供了支持的集成的完整列表。
身份验证
除了JupyterLab的内置安全模型之外,应用程序和Experience Platform之间的每次交互(包括平台服务到服务通信)都通过Adobe Identity Management System (IMS)进行加密和身份验证。
开发库
在Experience Platform中,JupyterLab为Python、R和PySpark提供预安装的库。 有关支持的库的完整列表,请参阅附录
库控制器
当预安装的库无法满足您的需求时,可以为Python和R安装其他库,并临时存储在隔离的容器中,以保持Platform的完整性并保持数据的安全。 有关更多详细信息,请参阅内核部分。
NOTE
其他库仅适用于安装这些库的会话。 在启动新会话时,必须重新安装所需的任何其他库。

与其他Platform服务集成 service-integration

标准化和互操作性是Experience Platform背后的关键概念。 将JupyterLab作为嵌入式IDE集成到Platform上后,可以与其他Platform服务进行交互,从而使您能够充分利用Platform。 以下Platform服务在JupyterLab中可用:

  • Catalog Service: ​访问和浏览具有读写功能的数据集。
  • Query Service: ​使用SQL访问和浏览数据集,在处理大量数据时提供较低的数据访问开销。
  • Sensei ML Framework: ​模型开发,能够训练数据和为数据评分,以及通过一次单击即可创建方法。
  • Experience Data Model (XDM): ​标准化和互操作性是Adobe Experience Platform背后的关键概念。 体验数据模型(XDM)由Adobe驱动,用于标准化客户体验数据和定义客户体验管理的架构。
NOTE
JupyterLab上的某些Platform服务集成仅限于特定内核。 有关更多详细信息,请参阅内核部分。

主要功能和常见操作

以下各节提供了有关JupyterLab的主要功能的信息以及执行常见操作的说明:

访问JupyterLab access-jupyterlab

Adobe Experience Platform中,从左侧导航列中选择​ 笔记本。 留出一段时间让JupyterLab完全初始化。

JupyterLab接口 jupyterlab-interface

JupyterLab界面由菜单栏、可折叠的左侧边栏以及包含文档和活动选项卡的主工作区组成。

菜单栏

界面顶部的菜单栏有顶级菜单,这些菜单显示JupyterLab中可用的操作及其键盘快捷键:

  • 文件: ​与文件和目录相关的操作
  • 编辑: ​与编辑文档和其他活动相关的操作
  • 视图: ​改变JupyterLab外观的操作
  • 运行: ​用于在不同的活动(如笔记本和代码控制台)中运行代码的操作
  • 内核: ​用于管理内核的操作
  • 选项卡: ​打开的文档和活动的列表
  • 设置: ​常用设置和高级设置编辑器
  • 帮助: JupyterLab和内核帮助链接的列表

左侧栏

左侧边栏包含可单击的选项卡,通过这些选项卡可访问以下功能:

  • 文件浏览器: ​已保存笔记本文档和目录的列表
  • 数据资源管理器: ​浏览、访问和浏览数据集和架构
  • 正在运行内核和终端: ​能够终止的活动内核和终端会话列表
  • 命令: ​有用的命令列表
  • 单元格检查器: ​单元格编辑器,用于访问可用于设置笔记本以进行演示的工具和元数据
  • 选项卡: ​打开的选项卡列表

选择选项卡以显示其功能,或在展开的选项卡上选择以折叠左侧边栏,如下所示:

主工作区

JupyterLab中的主工作区允许您将文档和其他活动排列到选项卡面板中,这些面板可以调整大小或进行细分。 将选项卡拖到选项卡面板的中心以迁移选项卡。 通过将选项卡拖到面板的左侧、右侧、顶部或底部来划分面板:

Python/R中的GPU和内存服务器配置

在JupyterLab中,选择右上角的齿轮图标以打开​ 笔记本服务器配置。 您可以通过滑块打开GPU并分配所需的内存量。 可分配的内存量取决于您的组织已配置的内存量。 选择​ 更新配置 ​以进行保存。

NOTE
每个组织只能为Notebooks配置一个GPU。 如果GPU正在使用中,则需要等待当前已保留GPU的用户将其释放。 可以通过注销或让GPU处于空闲状态四小时或更长时间来完成此操作。

终止并重新启动JupyterLab

在JupyterLab中,您可以终止会话以防止使用其他资源。 首先选择​ 电源图标 电源图标 ,然后从似乎将终止会话的弹出框中选择​ 关闭。 笔记本会话在12小时不活动后自动终止。

若要重新启动JupyterLab,请选择电源图标左边的​ 重新启动图标 重新启动图标 ,然后从显示的弹出框中选择​ 重新启动

终止jupyterlab

编码单元格 code-cells

代码单元格是笔记本的主要内容。 它们包含以笔记本关联内核的语言编写的源代码,以及执行代码单元后的输出。 执行计数显示在每个代码单元格的右侧,表示其执行顺序。

下面介绍了常见的单元格操作:

  • 添加单元格: ​单击笔记本菜单中的加号(+)可添加空单元格。 新单元格被放置在当前正在交互的单元格下方,如果没有特定单元格处于焦点位置,则位于笔记本的末尾。

  • 移动单元格: ​将光标放在要移动的单元格的右侧,然后单击并将单元格拖到新位置。 此外,将单元格从一个笔记本移动到另一个笔记本会复制该单元格及其内容。

  • 执行单元格: ​单击要执行的单元格正文,然后单击笔记本菜单中的​ 播放 ​图标()。 当内核正在处理执行时,单元格的执行计数器中会显示一个星号(*),完成时该星号会被替换为整数。

  • 删除单元格: ​单击要删除单元格的正文,然后单击​ 剪刀 ​图标。

内核 kernels

笔记本内核是用于处理笔记本电池的语言特定计算引擎。 除了Python之外,JupyterLab还在R、PySpark和Spark (Scala)中提供其他语言支持。 打开笔记本文档时,会启动关联的内核。 当执行笔记本单元时,内核执行计算并产生可能消耗大量CPU和内存资源的结果。 请注意,在关闭内核之前,不会释放分配的内存。

某些特性和功能仅限于下表所述的特定内核:

核心
库安装支持
Platform集成
Python
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R
  • Sensei ML Framework
  • Catalog Service
Scala
  • Sensei ML Framework
  • Catalog Service

内核会话 kernel-sessions

JupyterLab上的每个活动笔记本或活动都使用内核会话。 通过展开左侧边栏中的​ 正在运行的终端和内核 ​选项卡,可以找到所有活动会话。 通过观察笔记本界面的右上角,可以识别笔记本内核的类型和状态。 在下图中,笔记本的关联内核为​ Python3,其当前状态由右侧的灰色圆圈表示。 空心圆表示空闲内核,实心圆表示繁忙内核。

如果内核关闭或长时间处于非活动状态,则​ 无内核!显示带实心圆的。 单击内核状态并选择适当的内核类型来激活内核,如下所示:

启动器 launcher

自定义的​ 启动器 ​可为支持的内核提供有用的笔记本模板,以帮助您启动任务,包括:

模板
描述
空白
一个空的笔记本文件。
起始页
一个预填充的笔记本,演示使用示例数据探索数据。
零售业
使用样本数据预填充的笔记本,其中包含零售销售方法
Recipe Builder
用于在JupyterLab中创建食法的笔记本模板。 它预先填充了说明和描述处方创建过程的代码和评注。 有关详细演练,请参阅笔记本到方法教程
Query Service
预填充的笔记本,用于演示直接在JupyterLab中使用Query Service,并提供大规模分析数据的示例工作流。
XDM事件
一个预填充的笔记本,演示关于后值体验事件数据的数据探索,重点介绍整个数据结构中的共有功能。
XDM查询
一个预填充的笔记本,用于演示有关体验事件数据的示例业务查询。
聚合
一个预填充的笔记本,演示将大量数据聚合到较小、可管理的块中的示例工作流。
聚类
一个预填充的笔记本,演示使用聚类算法的端到端机器学习建模过程。

某些笔记本模板仅限于某些内核。 每个内核的模板可用性如下表所示:

空白
起始者
零售业
方法生成器
Query Service
XDM事件
XDM查询
聚合
聚类
Python
R
PySpark 3 (Spark 2.4)
Scala

要打开新的​ 启动器,请单击​ 文件>新建启动器。 或者,从左侧边栏展开​ 文件浏览器,然后单击加号(+):

后续步骤

要了解有关每个受支持的笔记本及其使用方法的更多信息,请访问Jupyterlab notebooks数据访问开发人员指南。 本指南重点介绍如何使用JupyterLab笔记本访问您的数据,包括读取、写入和查询数据。 数据访问指南还包含有关每个受支持的笔记本可读取的最大数据量的信息。

支持的库 supported-libraries

要获取Python、R和PySpark中支持的包列表,请将!conda list复制并粘贴到新单元格中,然后运行该单元格。 系统按字母顺序填充了受支持的资源包列表。

示例

此外,还使用了下列依赖项,但未列出:

  • CUDA 11.2
  • CUDNN 8.1
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9