JupyterLab UI概觀

JupyterLab 是Project Jupyter的網路使用者介 面,並與Adobe Experience Platform緊密整合。它為資料科學家提供互動式開發環境,以便與Jupyter Notebooks、程式碼和資料搭配使用。

本檔案概述JupyterLab及其功能,以及執行常見動作的指示。

JupyterLab on Experience Platform

Experience Platform的JupyterLab整合隨附架構變更、設計考量、自訂的筆記型電腦擴充功能、預先安裝的程式庫和Adobe主題介面。

下列清單概述JupyterLab在Platform上獨有的一些功能:

功能 說明
內核 內核提供筆記型電腦和其他JupyterLab前端,以不同的寫程式語言執行和查看代碼。 Experience Platform 提供額外的內核,以支 Python援R、PySpark和的開發 Spark。有關詳細資訊,請參閱kernels部分。
資料存取 直接從JupyterLab中訪問現有資料集,並完全支援讀寫功能。
Platform服務整合 內建整合可讓您直接從JupyterLab內運用其他Platform服務。 與其他平台服務整合一節提供支援整合的完整清單。
驗證 除了JupyterLab的內建安全性模型外,您的應用程式與Experience Platform(包括平台服務對服務通訊)之間的每次互動都會透過Adobe Identity Management System (IMS)進行加密和驗證。
開發程式庫 在Experience Platform中,JupyterLab提供了Python、R和PySpark的預安裝庫。 有關支援庫的完整清單,請參見附錄
程式庫控制器 當預先安裝的程式庫不符合您的需求時,可為Python和R安裝其他程式庫,並暫時儲存在隔離的容器中,以維持Platform的完整性並確保資料安全。 有關詳細資訊,請參閱kernels部分。
注意

其他程式庫僅適用於安裝程式庫的作業階段。 啟動新會話時,必須重新安裝所需的任何其他庫。

與其他Platform服務整合

標準化和互操作性是Experience Platform背後的關鍵概念。 將Platform上的JupyterLab整合為內嵌IDE,可讓它與其他Platform服務互動,讓您充份運用Platform。 JupyterLab提供以下Platform服務:

  • Catalog Service:訪 問和探索具有讀寫功能的資料集。
  • Query Service:使 用SQL訪問和瀏覽資料集,在處理大量資料時提供較低的資料存取開銷。
  • Sensei ML Framework:可 以訓練和分數資料的模型開發,以及只需按一下即可建立方式。
  • Experience Data Model (XDM):標 準化和互操作性是Adobe Experience Platform的主要概念。Adobe推動的Experience Data Model(XDM),旨在標準化客戶體驗資料並定義客戶體驗管理的架構。
注意

JupyterLab上的某些Platform服務整合僅限於特定內核。 有關詳細資訊,請參閱kernels上的一節。

主要功能與常用作業

有關JupyterLab的主要功能和執行常見操作的說明的資訊,請參見以下各節:

存取 JupyterLab

Adobe Experience Platform中,從左側導覽欄選取​Notebooks。 請讓JupyterLab稍候完全初始化。

JupyterLab 介面

JupyterLab介麵包含功能表列、可折疊的左側邊欄,以及包含檔案和活動標籤的主要工作區。

選單列

介面頂部的菜單欄具有頂級菜單,這些菜單使用鍵盤快捷鍵顯示JupyterLab中的可用操作:

  • 檔案:與 檔案和目錄相關的操作
  • 編輯:與編 輯文檔和其他活動相關的操作
  • 檢視: 改變外觀的動作 JupyterLab
  • Run:在不 同活動(例如筆記型電腦和程式碼主控台)中執行程式碼的動作
  • 內核:用 於管理內核的操作
  • 頁籤: 開啟的文檔和活動的清單
  • 設定:常 用設定和進階設定編輯器
  • 幫助: 和內核幫 JupyterLab 助連結清單

左側欄

左側邊欄包含可點選的標籤,可存取下列功能:

  • 檔案瀏覽器: 已保存的筆記本文檔和目錄清單
  • 資料總管: 瀏覽、存取和探索資料集和結構
  • 運行內核和終端: 具有終止能力的活動內核和終端會話清單
  • 命令: 有用命令的清單
  • 儲存格檢視 器:儲存格編輯器,可存取工具和中繼資料,以用於設定筆記型電腦以進行簡報
  • 頁籤: 開啟的頁籤清單

按一下標籤以顯示其功能,或按一下展開的標籤以收合左側邊欄,如下所示:

主要工作區

JupyterLab中的主要工作區域可讓您將檔案和其他活動排列成標籤面板,這些標籤可以調整大小或細分。 將標籤拖曳至標籤面板的中央,以移轉標籤。 將標籤拖曳至面板的左、右、上或下方,以劃分面板:

代碼單元格

代碼單元格是筆記型電腦的主要內容。 它們包含的原始碼為筆記型電腦相關內核的語言,以及執行代碼單元格後的輸出。 每個代碼單元格的右側顯示一個執行計數,該代碼單元格表示其執行順序。

常見的儲存格動作說明如下:

  • 添加單元格: 從筆記本菜單中按一下加號(+)可添加空單元格。新儲存格會置於目前正在互動的儲存格下方,或在筆記型電腦的結尾處(如果沒有特定儲存格在焦點中)。

  • 移動單元格:將 游標置於要移動的單元格的右側,然後按一下並將單元格拖動到新位置。此外,將一個單元格從一個筆記本移動到另一個筆記本會複製該單元格及其內容。

  • 執行儲存格: 按一下您要執行之儲存格的內文,然後從筆記型電腦選單 ​按一▶下播放圖示()。當內核處理執行時,在單元格的執行計數器中顯示星號(*),並在完成時被整數替換。

  • 刪除儲存格: 按一下您要刪除之儲存格的內文,然後按一下剪 ​式圖示。

內核

筆記型電腦內核是用於處理筆記型電腦單元的語言專用計算引擎。 除了Python外,JupyterLab還提供R、PySpark和Spark (Scala)中的其他語言支援。 開啟筆記本文檔時,將啟動關聯內核。 當執行筆記本單元時,內核執行計算並產生可能消耗大量CPU和記憶體資源的結果。 請注意,在內核關閉之前,不會釋放已分配的記憶體。

某些特性和功能限於下表所述的特定內核:

內核 資料庫安裝支援 Platform 整合
Python
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R
  • Sensei ML Framework
  • Catalog Service
斯卡拉
  • Sensei ML Framework
  • Catalog Service

內核會話

JupyterLab上的每個活動筆記本或活動都使用內核會話。 通過從左側邊欄展開​運行終端和內核​頁籤,可以找到所有活動會話。 通過觀察筆記本介面的右上角,可以確定筆記本內核的類型和狀態。 在下圖中,筆記本的關聯內核為​Python3 ,其當前狀態由右側的灰色圓表示。 空心圓表示空閒內核,實心圓表示忙碌內核。

如果內核長時間處於關閉或非活動狀態,則​無內核! 顯示實心圓。通過按一下內核狀態並選擇相應的內核類型激活內核,如下所示:

啟動器

自定義的​Launcher​為支援的內核提供了實用的筆記本模板,可幫助您啟動任務,包括:

範本 說明
空白 空的筆記本檔案。
入門者 預填充的筆記型電腦演示使用樣本資料進行資料探索。
零售銷售 一種預填充的筆記型電腦,其特徵是使用樣本資料使零售銷售方式
方式產生器 用於在JupyterLab中建立配方的筆記本模板。 它預先填入程式碼和評註,以示範並說明方式建立程式。 請參閱筆記型電腦至配方教程以取得詳細的逐步說明。
Query Service 預填充的筆記本直接在JupyterLab中演示Query Service的使用情況,並提供了可大規模分析資料的示例工作流。
XDM事件 預先填入的筆記型電腦,展示後值Experience Event資料的資料探索,著重於資料結構中常見的功能。
XDM查詢 預先填入的筆記型電腦,展示Experience Event資料的範例商業查詢。
彙總 預先填充的筆記本演示了將大量資料匯總到較小、可管理的塊中的示例工作流。
集群 預填充的筆記型電腦,演示使用群集算法的端到端機器學習建模過程。

某些筆記型電腦模板僅限於某些內核。 每個內核的模板可用性在下表中映射:

空白 入門者 零售銷售 方式產生器 查詢服務 XDM事件 XDM查詢 彙總 集群
Python no no no
R no no no no no no
PySpark 3(Spark 2.4) no no no no no no
斯卡拉 no no no no no no

要開啟新的​Launcher,請按一下​「檔案」>「新建啟動程式」。 或者,從左側邊欄展開​檔案瀏覽器,然後按一下加號(+):

Python/R中的GPU和記憶體伺服器配置

在JupyterLab中,選擇右上角的齒輪表徵圖以開啟​筆記本伺服器配置。 您可以使用滑桿來切換GPU並分配所需的記憶體量。 可分配的記憶體量取決於您的組織已布建的記憶體量。 選擇​更新配置​以保存。

注意

每個組織只為筆記型電腦配置一個GPU。 如果GPU正在使用中,您需要等待目前已保留GPU的使用者釋放它。 若要這麼做,請登出或讓GPU處於閒置狀態達4小時以上。

後續步驟

若要進一步瞭解每個受支援的筆記型電腦以及如何使用它們,請造訪Jupyterlab筆記型電腦資料存取開發人員指南。 本指南著重說明如何使用JupyterLab筆記型電腦存取您的資料,包括讀取、寫入和查詢資料。 資料存取指南還包含每個支援的筆記型電腦可以讀取的最大資料量的資訊。

支援的程式庫

Python / R

資料庫 版本
筆記本 6.0.0
請求 2.22.0
隱晦 4.0.0
青葉 0.10.0
ipywidget 7.5.1
bokeh 1.3.1
gensim 3.7.3
ipyparallel 0.5.2
jq 1.6
keras 2.2.4
nltk 3.2.5
熊貓 0.22.0
潘達斯 0.7.3
6.0.0
scikit-image 0.15.0
scikit-learn 0.21.3
接骨 1.3.0
發癢 1.3.0
西伯恩 0.9.0
statmodels 0.10.1
彈性 5.1.0.17
gplot 0.11.5
py-xgboost 0.90
opencv 3.4.1
皮什帕克 2.4.3
火炬 1.0.1
wxpython 4.0.6
colorlover 0.3.0
geopandas 0.5.1
地源 2.1.0
風格 1.6.4
rpy2 2.9.4
r-essentials 3.6
r-arules 1.6_3
r-fpc 2.2_3
r-e1071 1.7_2
r-gam 1.16.1
r-gbm 2.1.5
r-ggthemes 4.2.0
r-ggvis 0.4.4
r-igraph 1.2.4.1
r-lapes 3.0
r-操縱 1.0.1
r-rocr 1.0_7
r-rmysql 0.10.17
r-rodbc 1.3_15
r-rsqlite 2.1.2
r-rstan 2.19.2
r-sqldf 0.4_11
r-存活 2.44_1.1
r-zoo 1.8_6
r弦長 0.9.5.2
r-quadprog 1.5_7
r-rjson 0.2.20
r-forecast 8.7
r-rsolnp 一點一六
r-網狀 一點一二
r-mlr 2.14.0
r-viridis 0.5.1
r-corplot 0.84
r-fnn 1.1.3
r-lubridate 1.7.4
r-隨機森林 4.6_14
逆向 1.2.1
r樹 1.0_39
皮蒙戈 3.8.0
pyarrow 0.14.1
boto3 1.9.199
ipyvolume 0.5.2
fast鑲木地板 0.3.2
python-snappy 0.5.4
ipywebrtc 0.5.0
jupyter_client 5.3.1
wordcloud 1.5.0
graphviz 2.40.1
python-graphviz 0.11.1
azure儲存 0.36.0
jupyterlab 1.0.4
熊貓-ml 0.6.1
tensorflow-gpu 1.14.0
nodejs 12.3.0
模擬 3.0.5
ipympl 0.3.3
fonts-anacond 1.0
psycopg 2.8.3
鼻子 1.3.7
autovizwidget 0.12.9
阿爾塔 3.1.0
vega_datasets 0.7.0
平磨機 1.0.1
sql_magic 0.0.4
iso3166 1.0
nbimporter 0.3.1

PySpark

資料庫 版本
請求 2.18.4
gensim 2.3.0
keras 2.0.6
nltk 3.2.4
熊貓 0.20.1
潘達斯 0.7.3
5.3.0
scikit-image 0.13.0
scikit-learn 0.19.0
接骨 0.19.1
發癢 1.3.3
statmodels 0.8.0
彈性 4.0.30.44
py-xgboost 0.60
opencv 3.1.0
pyarrow 0.8.0
boto3 1.5.18
azure-storage-blob 1.4.0
python 3.6.7
mkl-rt 11.1

本頁內容