JupyterLab UI概述

JupyterLab 是基於Web的用戶介面 朱佩特工程 並且緊密融入Adobe Experience Platform。 它為資料科學家提供了互動式開發環境,以便他們與Jupyter筆記本、代碼和資料一起工作。

此文檔提供 JupyterLab 以及執行常見操作的說明。

JupyterLab 上 Experience Platform

Experience Platform的JupyterLab整合附帶了架構更改、設計考慮、定製的筆記本擴展、預安裝的庫和Adobe主題介面。

以下清單概述了JupyterLab在平台上獨有的一些功能:

功能 說明
內核提供筆記本和其他 JupyterLab 前端是以不同寫程式語言執行和反映代碼的能力。 Experience Platform 提供其他內核以支援開發 Python、R、PySpark和 Spark。 查看 的子菜單。
資料存取 直接從中訪問現有資料集 JupyterLab 完全支援讀寫功能。
Platform服務整合 內置整合允許您利用其他 Platform 直接從內部 JupyterLab。 有關支援的整合的完整清單,請參見 與其他平台服務整合
驗證 JupyterLab的內置安全模型,應用程式與Experience Platform之間的每個交互(包括平台服務到服務通信)都通過加密和驗證 Adobe Identity Management System (IMS)
開發程式庫 在 Experience Platform。 JupyterLab 為 Python、R和PySpark。 查看 附錄 的子菜單。
庫控制器 當預安裝的庫因您的需要而不足時,可以為Python和R安裝其他庫,並臨時儲存在隔離的容器中以保持 Platform 保證資料安全。 查看 的子菜單。
注意

其他庫僅可用於安裝它們的會話。 啟動新會話時,必須重新安裝所需的任何其他庫。

與其他 Platform 服務

標準化和互操作性是其背後的關鍵概念 Experience Platform。 整合 JupyterLab 上 Platform 作為嵌入式IDE,它可以與其他 Platform 服務,使您能夠利用 Platform 它的潛力。 以下 Platform 服務 JupyterLab:

  • Catalog Service: 使用讀寫功能訪問和瀏覽資料集。
  • Query Service: 使用SQL訪問和瀏覽資料集,在處理大量資料時提供較低的資料存取開銷。
  • Sensei ML Framework: 能夠訓練和評分資料的模型開發,以及只需按一下即可建立處方。
  • Experience Data Model (XDM): 標準化和互操作性是Adobe Experience Platform背後的關鍵概念。 體驗資料模型(XDM)在Adobe的推動下,這是一種努力,目的是標準化客戶體驗資料並定義客戶體驗管理模式。
注意

部分 Platform 服務整合 JupyterLab 限於特定的內核。 請參閱上 的子菜單。

關鍵功能和常見操作

有關以下關鍵功能的資訊 JupyterLab 以下各節提供了有關執行常見操作的說明:

存取 JupyterLab

Adobe Experience Platform選中 筆記本 的下界。 允許一些時間 JupyterLab 完全初始化。

JupyterLab 介面

的 JupyterLab 介面由菜單欄、可折疊左側提要欄和包含文檔和活動頁籤的主工作區組成。

功能表列

介面頂部的菜單欄具有顯示操作的頂級菜單, JupyterLab 鍵盤快捷鍵:

  • 檔案: 與檔案和目錄相關的操作
  • 編輯: 與編輯文檔和其他活動相關的操作
  • 視圖: 改變外觀的操作 JupyterLab
  • 運行: 在不同活動(如筆記本和代碼控制台)中運行代碼的操作
  • 內核: 用於管理內核的操作
  • 頁籤: 開啟的文檔和活動清單
  • 設定: 常用設定和高級設定編輯器
  • 幫助: 清單 JupyterLab 和內核幫助連結

左側欄

左側提要欄包含可點擊的頁籤,可訪問以下功能:

  • 檔案瀏覽器: 保存的筆記本文檔和目錄清單
  • 資料資源管理器: 瀏覽、訪問和瀏覽資料集和架構
  • 運行內核和終端: 具有終止功能的活動內核和終端會話的清單
  • 命令: 有用命令清單
  • 單元格檢查器: 提供對工具和元資料的訪問的單元格編輯器,這些工具和元資料對於設定筆記本以用於演示目的非常有用
  • 頁籤: 開啟的頁籤清單

選擇一個頁籤以顯示其功能,或在展開的頁籤上選擇以折疊左側提要欄,如下所示:

主要工作區

中國 JupyterLab 允許您將文檔和其他活動排列到可調整大小或細分的頁籤面板中。 將標籤拖到標籤面板的中心以遷移標籤。 將頁籤拖動到面板的左、右、頂部或底部,以分隔面板:

GPU和記憶體伺服器配置 Python/R

在 JupyterLab 選擇右上角的齒輪表徵圖以開啟 筆記本伺服器配置。 可以通過使用滑塊開啟GPU並分配所需的記憶體量。 您可以分配的記憶體量取決於您的組織已調配的記憶體量。 選擇 更新配置 來保存。

注意

每個組織只為筆記本預配一個GPU。 如果GPU正在使用,則需要等待當前已保留GPU的用戶釋放它。 這可以通過註銷或將GPU處於空閒狀態達四小時或更長時間來完成。

終止並重新啟動 JupyterLab

在 JupyterLab,您可以終止會話,以防止使用更多資源。 從選擇 電源表徵圖 電源表徵圖,然後選擇 關閉 從終止會話的跨距。 筆記本會話在12小時無活動後自動終止。

重新啟動 JupyterLab,選擇 重新啟動表徵圖 重新啟動表徵圖 位於電源表徵圖的左側,然後選擇 重新啟動 從出現的跨距。

終止jupterlab

代碼單元格

代碼單元是筆記本的主要內容。 它們包含以筆記本關聯內核語言和作為執行代碼單元格結果的輸出的原始碼。 每個代碼單元的右側顯示一個執行計數,它表示其執行順序。

下面介紹了常用單元格操作:

  • 添加單元格: 按一下加號(+)以添加空單元格。 新的單元被放置在當前正在交互的單元下,或者如果沒有特定單元處於焦點中,則放置在筆記本的末尾。

  • 移動單元格: 將游標置於要移動的單元格的右側,然後按一下並將單元格拖動到新位置。 此外,將單元格從一個筆記本移動到另一個筆記本會複製該單元格及其內容。

  • 執行單元格: 按一下要執行的單元格的主體,然後按一下 表徵圖。)。 星號(*)在內核處理執行時顯示在單元格的執行計數器中,並在完成後替換為整數。

  • 刪除單元格: 按一下要刪除的單元格的正文,然後按一下 剪刀 表徵圖

筆記型電腦內核是處理筆記型電腦單元的語言特定計算引擎。 除 Python。 JupyterLab 在R、PySpark和 Spark (斯卡拉)。 開啟筆記本文檔時,將啟動關聯的內核。 當筆記本單元被執行時,內核執行計算並產生可能消耗大量CPU和記憶體資源的結果。 請注意,在內核關閉之前不會釋放已分配的記憶體。

下表所述,某些功能和特性僅限於特定內核:

內核 庫安裝支援 Platform 整合
Python
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R
  • Sensei ML Framework
  • Catalog Service
斯卡拉
  • Sensei ML Framework
  • Catalog Service

內核會話

每個活動筆記本或活動 JupyterLab 利用內核會話。 通過擴展 運行終端和內核 的下界。 可通過觀察筆記本介面的右上角來標識筆記本內核的類型和狀態。 在下圖中,筆記本的關聯內核是 Python3 其當前狀態由右邊的灰色圓表示。 空心圓表示空閒內核,實心圓表示忙碌內核。

如果內核長時間關閉或處於非活動狀態,則 無內核! 顯示實心圓。 通過按一下內核狀態並選擇相應的內核類型來激活內核,如下所示:

啟動程式

自定義 啟動程式 為支援的內核提供了有用的筆記本模板,以幫助您啟動任務,包括:

範本 說明
空白 空的筆記本檔案。
啟動器 預填充的筆記本演示使用示例資料的資料探索。
零售銷售 預填充筆記本 零售銷售處理 使用示例資料。
處方生成器 用於在中建立處方的筆記本模板 JupyterLab。 它預填充了演示和描述處方建立過程的代碼和注釋。 請參閱 筆記本 — 處方教程 詳細的漫步。
Query Service 預填充的筆記本演示了 Query Service 直接 JupyterLab 提供了以規模分析資料的示例工作流。
XDM事件 預填充的筆記本演示有關後值體驗事件資料的資料探索,重點介紹資料結構中常見的功能。
XDM查詢 預填充的筆記本演示有關體驗事件資料的示例業務查詢。
彙總 預填充的筆記本演示了將大量資料聚合到更小、可管理的塊中的示例工作流。
Clustering 一種預先填充的筆記本演示使用聚類算法的端到端機器學習建模過程。

某些筆記本模板限於某些內核。 下表映射了每個內核的模板可用性:

空白 啟動器 零售銷售 處方生成器 Query Service XDM事件 XDM查詢 彙總 聚類
Python no
R
PySpark 3(Spark 2.4)
斯卡拉

開啟新 啟動程式​按一下 「檔案」>「新建啟動程式」。 或者,展開 檔案瀏覽器 從左側欄中,按一下加號(+):

後續步驟

要瞭解有關每個受支援筆記本的詳細資訊以及如何使用這些筆記本,請訪問 Jupyterlab筆記本資料存取 的子菜單。 本指南重點介紹如何使用JupyterLab筆記本訪問資料,包括讀取、寫入和查詢資料。 資料存取指南還包含關於每個受支援筆記本可讀取的最大資料量的資訊。

支援的庫

有關Python、R和PySpark中支援的包的清單,請複製和貼上 !conda list 的子菜單。 支援的包清單按字母順序填充。

示例

此外,還使用但未列出以下依賴項:

  • CUDA 11.2
  • CUDN 8.1

本頁內容