文件 Experience Platform Data Science Workspace 指南

JupyterLab UI 概觀

Last update: Mon Aug 05 2024 00:00:00 GMT+0000 (Coordinated Universal Time)

主題：
資料科學工作區

建立對象：

使用者
開發人員

NOTE

Data Science Workspace已無法購買。

本檔案旨在供先前有權使用Data Science Workspace的現有客戶使用。

JupyterLab是Project Jupyter的網頁式使用者介面，且已緊密整合至Adobe Experience Platform。它提供互動式開發環境，讓資料科學家能夠使用Jupyter Notebooks、程式碼和資料。

本檔案提供JupyterLab及其功能的概觀，以及執行一般動作的指示。

Experience Platform上的JupyterLab

Experience Platform的JupyterLab整合伴隨著架構變更、設計考量、自訂的筆記型電腦擴充功能、預先安裝的程式庫，以及Adobe主題的介面。

下列清單概述JupyterLab on Platform的專屬功能：

功能

說明

核心

核心提供筆記型電腦和其他JupyterLab前端以不同程式語言執行和內部檢查程式碼的能力。 Experience Platform提供額外的核心以支援Python、R、PySpark和Spark中的開發。如需詳細資訊，請參閱核心區段。

數據存取

從內部 JupyterLab 直接存取現有資料集，完全支援讀寫功能。

Platform服務整合

內建整合可讓您直接從JupyterLab內使用其他Platform服務。在與其他Platform服務整合的區段中，提供支援整合的完整清單。

驗證

除了JupyterLab的內置安全模型外，您的應用程式和Experience Platform之間的每次交互，包括Platform服務到服務的通信，都通過（IMS）進行Adobe Identity Management System加密和身份驗證。

開發資料庫

在中 Experience Platform， JupyterLab 提供了、R 和 PySpark 的 Python預安裝資料庫。有關受支持資料庫的完整清單，請參閱附錄。

庫控制器

當預安裝的資料庫無法滿足您的需求時，可以為 Python 和 R 安裝額外的資料庫，並臨時存儲在隔離的容器中，以維護數據的完整性 Platform 並確保數據的安全。如需詳細資訊，請參閱核心區段。

NOTE

其他程式庫僅適用於已安裝這些程式庫的工作階段。啟動新工作階段時，您必須重新安裝任何其他所需的程式庫。

與其他Platform服務整合 service-integration

標準化和互通性是Experience Platform背後的重要概念。將Platform上的JupyterLab整合為內嵌IDE，可讓您與其他Platform服務互動，讓您充分利用Platform的潛力。下列Platform服務可在JupyterLab中使用：

Catalog Service： 使用讀寫功能訪問和瀏覽數據集。
Query Service： 使用 SQL 訪問和瀏覽資料集，在處理大量數據時提供更低的數據訪問開銷。
Sensei ML Framework： 模型開發，能夠訓練和評分數據，只需按一下即可創建方式。
Experience Data Model (XDM)： 標準化和互操作性是Adobe Experience Platform背後的關鍵概念。體驗資料模型(XDM)由Adobe驅動，致力於標準化客戶體驗資料並定義客戶體驗管理的結構描述。

NOTE

JupyterLab上的某些Platform服務整合僅限特定核心。如需詳細資訊，請參閱核心的章節。

主要功能與常見操作

有關JupyterLab主要功能的資訊，以及執行一般作業的指示在以下各節中提供：

存取JupyterLab
JupyterLab介面
Code儲存格
內核
內核會話
發射

存取JupyterLab access-jupyterlab

在Adobe Experience Platform中，從左側導覽欄選取 筆記本。留出時間讓JupyterLab完全初始化。

JupyterLab 介面 jupyterlab-interface

該 JupyterLab 介面由功能表欄、可摺疊左側邊欄以及包含文件和活動選項卡的主工作區組成。

功能表欄

介面頂部的功能表列具有頂級功能表，這些功能表顯示其鍵盤快捷鍵中可用的 JupyterLab 操作：

檔案： 與檔案和目錄相關的動作
編輯： 與編輯檔案和其他活動相關的動作
檢視： 變更JupyterLab外觀的動作
執行： 在不同活動（例如筆記本和程式碼主控台）中執行程式碼的動作
核心： 管理核心的動作
標籤： 開啟的檔案和活動清單
設定： 一般設定和進階設定編輯器
說明： JupyterLab與核心說明連結的清單

左側欄

左側邊欄包含可點按的標籤，可讓您存取以下功能：

檔案瀏覽器： 已儲存的筆記本檔案和目錄清單
資料總管： 瀏覽、存取及探索資料集和結構描述
正在執行核心與終端機： 具有終止功能的作用中核心與終端機工作階段清單
命令： 有用的命令清單
儲存格檢視窗： 儲存格編輯器，可讓您存取用來設定筆記本以供簡報使用的工具和中繼資料
標籤： 開啟的標籤清單

選取標籤以公開其功能，或在展開的標籤上選取以摺疊左側邊欄，如下所示：

主要工作區

JupyterLab中的主要工作區域可讓您將檔案和其他活動排列成可調整大小或可再分割的標籤面板。將標籤拖曳至標籤面板中央以移轉標籤。將標籤拖曳至面板的左側、右側、頂端或底部來分割面板：

Python/R中的GPU和記憶體伺服器組態

在JupyterLab中，選取右上角的齒輪圖示以開啟 Notebook伺服器組態。您可以使用滑桿打開 GPU 並分配所需的內存量。可以分配的內存量取決於組織已預配的內存量。選擇「更新配置」以保存。

NOTE

每個組織僅為筆記型電腦預配一個 GPU。如果GPU正在使用中，您需要等待目前保留GPU的使用者釋出它。登出或讓GPU處於閒置狀態四個小時以上，即可完成這項作業。

終止並重新啟動JupyterLab

在JupyterLab中，您可以終止工作階段以防止使用其他資源。開始方法是選擇電源圖示，然後從彈出的彈出視窗中選擇關機，以終止會話。筆記本會話在 12 小時無活動後自動終止。

要重新啟動 JupyterLab，請選擇 直接位於電源圖示左側的重新啟動圖示 重新啟動圖示，然後 從顯示的彈出視窗中選擇重新啟動。

終止 Jupyterlab

Code儲存格 code-cells

Code單元是筆記本的主要內容。它們包含筆記本關聯內核語言的原始程式碼以及執行代碼單元的結果輸出。執行計數顯示在表示其執行順序的每個代碼儲存格的右側。

常見的儲存格操作如下所述：

新增儲存格： 按一下筆記本功能表中的加號符號(+)以新增空白儲存格。新儲存格會放置在目前互動的儲存格下方，如果沒有特定儲存格處於焦點，則位於筆記本的結尾。
移動儲存格： 將游標放在您要移動的儲存格右側，然後按一下並將儲存格拖曳到新的位置。此外，將儲存格從一個筆記本移到另一個筆記本會複製儲存格及其內容。
執行儲存格： 按一下您要執行的儲存格內文，然後按一下筆記本功能表中的播放圖示(▶)。當核心處理執行時，儲存格的執行計數器會顯示星號(*)，並在完成時以整數取代。
刪除單元格： 按下要刪除的儲存格的正文，然後按下剪刀圖示。

核心 kernels

筆記型電腦核心是處理筆記型電腦儲存格的語言專屬運算引擎。除了Python，JupyterLab還提供R、PySpark和Spark (Scala)的額外語言支援。當您開啟筆記本檔案時，會啟動相關的核心。執行筆記型電腦儲存格時，核心會執行運算並產生耗用大量CPU和記憶體資源的結果。請注意，在關閉核心之前，不會釋放配置的記憶體。

某些特性和功能僅限於特定的內核，如下表所述：

核心

庫安裝支援

Platform 集成

Python

是

Sensei ML Framework
Catalog Service
Query Service

是

Sensei ML Framework
Catalog Service

Scala

無

Sensei ML Framework
Catalog Service

內核會話 kernel-sessions

JupyterLab上的每個使用中筆記本或活動都使用核心工作階段。從左側邊欄展開 執行中的終端機和核心 標籤，即可找到所有使用中的工作階段。觀察筆記型電腦介面的右上角，即可識別筆記型電腦核心的型別和狀態。在下圖中，筆記本的關聯核心為 Python3，其目前狀態由右邊的灰色圓圈表示。空心圓表示閒置核心，實心圓表示忙碌核心。