JupyterLab ユーザーガイド

JupyterLab は、プロジェクト Jupyter の Web ベースのユーザーインターフェイスで、Adobe Experience Platform に緊密に統合されています。これは、データ科学者が Jupyter のノートブック、コード、データを扱うための、インタラクティブな開発環境を提供します。

This document provides an overview of JupyterLab and its features as well as instructions to perform common actions.

JupyterLab on Experience Platform

Experience Platform の JupyterLab 統合には、アーキテクチャの変更、デザイン上の考慮事項、カスタマイズされたノートブック拡張機能、プリインストールされたライブラリ、アドビをテーマにしたインターフェイスが付属しています。

次のリストでは、Platform 上の JupyterLab に固有の機能の一部を説明します。

機能 説明
カーネル Kernels provide notebook and other JupyterLab front-ends the ability to execute and introspect code in different programming languages. Experience Platform は、 Python、R、PySpark、およびでの開発をサポートする追加カーネルを提供 Sparkします。 詳しくは「カーネル」の節を参照してください。
データアクセス Access existing datasets directly from within JupyterLab with full support for read and write capabilities.
Platformサービス統合 Built-in integrations allows you to utilize other Platform services directly from within JupyterLab. サポートされる統合の完全なリストは、「他の Platform サービスとの統合」の節に記載されています。
認証 JupyterLab の組み込みのセキュリティモデルに加えて、Platform のサービス間通信を含む、アプリケーションと Experience Platform の間のすべてのやり取りは、Adobe Identity Management System(IMS)を通じて暗号化され、認証されます。
開発ライブラリ では、 Experience Platform、R、PySpark用に事前にインストールされたライブラリを JupyterLabPython提供します。 サポートされているライブラリの完全なリストについては、付録を参照してください。
ライブラリコントローラー When the the pre-installed libraries are lacking for your needs, additional libraries can be installed for Python and R, and are temporarily stored in isolated containers to maintain the integrity of Platform and keep your data safe. 詳しくは「カーネル」の節を参照してください。
メモ

追加のライブラリは、インストールされたセッションでのみ使用できます。新しいセッションを開始する際に必要な追加のライブラリを再インストールする必要があります。

Integration with other Platform services

Standardization and interoperability are key concepts behind Experience Platform. The integration of JupyterLab on Platform as an embedded IDE allows it to interact with other Platform services, enabling you to utilize Platform to its full potential. The following Platform services are available in JupyterLab:

  • Catalog Service: 読み取り/書き込み機能を備えたデータセットへのアクセスと調査
  • Query Service: SQLを使用してデータセットにアクセスし、データセットを調査します。大量のデータを処理する際に、データ・アクセスのオーバーヘッドが低くなります。
  • Sensei ML Framework: データのトレーニングとスコア機能を備えたモデル開発と、1回のクリックでレシピを作成。
  • Experience Data Model (XDM): 標準化と相互運用性は、Adobe Experience Platformの主な概念です。 Adobeに基づくExperience Data Model(XDM)は、顧客体験データを標準化し、顧客体験管理のスキーマを定義する取り組みです。
メモ

Some Platform service integrations on JupyterLab are limited to specific kernels. 詳しくは「カーネル」の節を参照してください。

主な機能と一般的な操作

Information regarding key features of JupyterLab and instructions on performing common operations are provided in the sections below:

アクセス JupyterLab

Adobe Experience Platform」で、左のナビゲーション列から「 ノートブック 」を選択します。 Allow some time for JupyterLab to fully initialize.

JupyterLab インターフェイス

The JupyterLab interface consists of a menu bar, a collapsible left sidebar, and the main work area containing tabs of documents and activities.

メニューバー

The menu bar at the top of the interface has top-level menus that expose actions available in JupyterLab with their keyboard shortcuts:

  • ファイル:ファイルとディレクトリに関連するアクション
  • 編集:編集に関するアクションおよびドキュメントのアクティビティ
  • 表示 : の外観を変更するアクションJupyterLab
  • 実行:ノートブックやコードコンソールなど、異なるアクティビティでコードを実行するアクション
  • カーネル :カーネル管理のアクション
  • タブ:開いているドキュメントとアクティビティのリスト
  • 設定:共通設定と詳細設定エディター
  • **ヘルプ​**JupyterLab: とカーネルのヘルプリンクのリスト

左サイドバー

左側のサイドバーには、次の機能にアクセスできるクリック可能なタブが含まれています。

  • ファイルブラウザー:保存されたノートブックドキュメントとディレクトリのリスト
  • データエクスプローラー:データセットとスキーマ
  • カーネルとターミナルの実行:終了する機能を持つアクティブなカーネルとターミナルセッションのリスト
  • コマンド:便利なコマンドのリスト
  • セルインスペクター :プレゼンテーション用にノートブックを設定する際に役立つツールやメタデータにアクセスできるセルエディター。
  • タブ:開いたタブのリスト

タブをクリックしてその機能を表示するか、展開されたタブをクリックして左側のサイドバーを折りたたみます。以下に例を示します。

メイン作業領域

The main work area in JupyterLab enables you to arrange documents and other activities into panels of tabs that can be resized or subdivided. タブをタブパネルの中央にドラッグして、タブを移行します。タブをパネルの左、右、上または下にドラッグして、パネルを分割します。

コードセル

コードセルは、ノートブックの主なコンテンツです。これらには、ノートブックの関連カーネルの言語のソースコードと、コードセルを実行した結果の出力が含まれています。実行回数は、実行順序を表す各コードセルの右側に表示されます。

一般的なセルのアクションを以下に示します。

  • セルの追加:ノートブックメニューのプラス記号(+)をクリックして、空のセルを追加します。新しいセルは、現在操作中のセルの下に配置されます。特定のセルにフォーカスがない場合は、ノートブックの最後に配置されます。

  • セルの移動:移動するセルの右側にカーソルを置き、セルをクリックして新しい位置にドラッグします。また、あるノートブックから別のノートブックにセルを移動すると、セルとその内容が複製されます。

  • セルの実行:実行するセルのボディをクリックし、ノートブックメニューの​再生​アイコン()をクリックします。カーネルが実行を処理する際には、セルの実行カウンターにアスタリスク(*)が表示され、完了時には整数に置き換えられます。

  • セルの削除:削除するセルのボディをクリックし、はさみ​アイコンをクリックします。

カーネル

ノートのカーネルは、ノートのセルを処理するための言語固有のコンピューティングエンジンです。In addition to Python, JupyterLab provides additional language support in R, PySpark, and Spark (Scala). ノートブックドキュメントを開くと、関連するカーネルが起動します。ノートブックセルが実行されると、カーネルは計算をおこない、結果を生成し、CPU やメモリリソースを大量に消費する可能性があります。割り当てられたメモリは、カーネルがシャットダウンされるまで解放されないことに注意してください。

特定の機能は、以下の表で説明するように、特定のカーネルに限定されています。

カーネル ライブラリのインストールサポート Platform 統合
Python
  • Sensei ML Framework
  • Catalog Service
  • Query Service
R
  • Sensei ML Framework
  • Catalog Service
Scala ×
  • Sensei ML Framework
  • Catalog Service

カーネルセッション

Each active notebook or activity on JupyterLab utilizes a kernel session. すべてのアクティブなセッションは、左側のサイドバーから「実行中の端末とカーネル」タブを展開すると見つかります。ノートブックのカーネルのタイプと状態は、ノートブックのインターフェースの右上を見ることで識別できます。下の図では、ノートブックに関連するカーネルは Python3 で、現在の状態は右側に灰色の円で表されています。中空の円はアイドルカーネルを意味し、実円はビジーカーネルを意味します。

カーネルがシャットダウンされたり、長時間使用されない場合は、カーネルなし が実円と表示されます。カーネルの状態をクリックし、以下に示すように適切なカーネルタイプを選択して、カーネルをアクティブにします。

ランチャー

カスタマイズされた Launcher は、次のような、サポートされているカーネル用の便利なノートブックテンプレートを提供し、タスクを開始するのに役立ちます。

テンプレート 説明
空白 空のノートブックファイル。
スターター サンプルデータを使用したデータ調査を示す、事前入力済みのノートブック。
小売売上 A pre-filled notebook featuring the retail sales recipe using sample data.
レシピビルダー A notebook template for creating a recipe in JupyterLab. レシピの作成プロセスを示し、説明するコードとコメントが事前に記入されています。詳細な順を追った説明については、『ノートブックのレシピチュートリアル』を参照してください。
Query Service A pre-filled notebook demonstrating the usage of Query Service directly in JupyterLab with provided sample workflows that analyzes data at scale.
XDM イベント データ構造全体に共通の機能に焦点を当てた、ポストバリューエクスペリエンスイベントデータのデータ探索を示す、事前入力済みのノートブック。
XDM クエリ エクスペリエンスのイベントデータに関するサンプルのビジネスクエリを示す、事前入力済みのノートブック。
集計 大量のデータをより小さく管理しやすいチャンクに集約するサンプルワークフローを示す、事前入力済みのノートブック。
クラスタリング クラスタリングアルゴリズムを使用したエンドツーエンドの機械学習モデリングプロセスを示す、事前入力済みのノートブック。

一部のノートブックテンプレートは、特定のカーネルに限定されています。各カーネルのテンプレートの可用性は、次の表にマッピングされます。

空白 スターター 小売売上 レシピビルダー クエリサービス XDM イベント XDM クエリ 集計 クラスタリング
Python いいえ いいえ いいえ
R いいえ いいえ いいえ いいえ いいえ いいえ
PySpark 3 (Spark 2.4) いいえ いいえ いいえ いいえ いいえ いいえ
Scala いいえ いいえ いいえ いいえ いいえ いいえ

新しい​ランチャー​を開くには、ファイル/新規ランチャー​をクリックします。または、左のサイドバーで​ファイルブラウザー​を展開し、プラス記号(+)をクリックします。

GPUと Python/Rでのメモリサーバーの設定

で、右上隅の歯車アイコンを JupyterLab 選択して、 ノートブックサーバー設定を開きます。 GPUのオン/オフを切り替え、スライダーを使用して必要なメモリ量を割り当てることができます。 割り当て可能なメモリの量は、組織でプロビジョニングされているメモリの量によって異なります。 「 設定を更新 」を選択して保存します。

メモ

1つの組織でノートブック用にプロビジョニングされるGPUは1つだけです。 GPUが使用中の場合は、現在GPUを予約しているユーザーがGPUを解放するのを待つ必要があります。 これは、GPUをログアウトするか、4時間以上アイドル状態のままにすることで実行できます。

次の手順

サポートされる各ノートブックとその使用方法の詳細については、 Jupyterlab notebooks data access developer guideを参照してください。 このガイドでは、JupyterLabノートブックを使用して、データの読み取り、書き込み、クエリなど、データにアクセスする方法について説明します。 また、サポートされる各ノートブックで読み取れる最大データ量に関する情報も記載されています。

サポートされるライブラリ

Python / R

ライブラリ バージョン
notebook 6.0.0
requests 2.22.0
plotly 4.0.0
folium 0.10.0
ipywidgets 7.5.1
bokeh 1.3.1
gensim 3.7.3
ipyparallel 0.5.2
jq 1.6
keras 2.2.4
nltk 3.2.5
pandas 0.22.0
pandasql 0.7.3
pillow 6.0.0
scikit-image 0.15.0
scikit-learn 0.21.3
scipy 1.3.0
scrapy 1.3.0
seaborn 0.9.0
statsmodels 0.10.1
elastic 5.1.0.17
ggplot 0.11.5
py-xgboost 0.90
opencv 3.4.1
pyspark 2.4.3
pytorch 1.0.1
wxpython 4.0.6
colorlover 0.3.0
geopandas 0.5.1
pyshp 2.1.0
shapely 1.6.4
rpy2 2.9.4
r-essentials 3.6
r-arules 1.6_3
r-fpc 2.2_3
r-e1071 1.7_2
r-gam 1.16.1
r-gbm 2.1.5
r-ggthemes 4.2.0
r-ggvis 0.4.4
r-igraph 1.2.4.1
r-leaps 3.0
r-manipulate 1.0.1
r-rocr 1.0_7
r-rmysql 0.10.17
r-rodbc 1.3_15
r-rsqlite 2.1.2
r-rstan 2.19.2
r-sqldf 0.4_11
r-survival 2.44_1.1
r-zoo 1.8_6
r-stringdist 0.9.5.2
r-quadprog 1.5_7
r-rjson 0.2.20
r-forecast 8.7
r-rsolnp 1.16
r-reticulate 1.12
r-mlr 2.14.0
r-viridis 0.5.1
r-corrplot 0.84
r-fnn 1.1.3
r-lubridate 1.7.4
r-randomforest 4.6_14
r-tidyverse 1.2.1
r-tree 1.0_39
pymongo 3.8.0
pyarrow 0.14.1
boto3 1.9.199
ipyvolume 0.5.2
fastparquet 0.3.2
python-snappy 0.5.4
ipywebrtc 0.5.0
jupyter_client 5.3.1
wordcloud 1.5.0
graphviz 2.40.1
python-graphviz 0.11.1
azure-storage 0.36.0
jupyterlab 1.0.4
pandas_ml 0.6.1
tensorflow-gpu 1.14.0
nodejs 12.3.0
mock 3.0.5
ipympl 0.3.3
fonts-anacond 1.0
psycopg2 2.8.3
nose 1.3.7
autovizwidget 0.12.9
altair 3.1.0
vega_datasets 0.7.0
papermill 1.0.1
sql_magic 0.0.4
iso3166 1.0
nbimporter 0.3.1

PySpark

ライブラリ バージョン
requests 2.18.4
gensim 2.3.0
keras 2.0.6
nltk 3.2.4
pandas 0.20.1
pandasql 0.7.3
pillow 5.3.0
scikit-image 0.13.0
scikit-learn 0.19.0
scipy 0.19.1
scrapy 1.3.3
statsmodels 0.8.0
elastic 4.0.30.44
py-xgboost 0.60
opencv 3.1.0
pyarrow 0.8.0
boto3 1.5.18
azure-storage-blob 1.4.0
python 3.6.7
mkl-rt 11.1

このページ