JupyterLab UI の概要
JupyterLab は、プロジェクト Jupyter の web ベースのユーザーインターフェイスで、Adobe Experience Platform に緊密に統合されています。これは、データサイエンティストが Jupyter Notebook、コードおよびデータを扱うためのインタラクティブな開発環境を提供します。
このドキュメントでは、JupyterLab とその機能の概要のほか、一般的なアクションを実行する手順を説明します。
Experience Platform 上の JupyterLab
Experience Platform の JupyterLab 統合には、アーキテクチャの変更、デザイン上の考慮事項、カスタマイズされたノートブック拡張機能、プリインストールされたライブラリ、アドビをテーマにしたインターフェイスが付属しています。
次のリストでは、Platform 上の JupyterLab に固有の機能の一部を説明します。
他の Platform サービスとの統合 service-integration
標準化と相互運用性は、Experience Platform を支える重要な概念です。Platform 上の JupyterLab を組み込み IDE として統合することで、他の Platform サービスとのやり取りが可能になり、Platform を最大限に活用できます。JupyterLab では、次の Platform サービスを使用できます。
- Catalog Service: 読み取りおよび書き込み機能でデータセットにアクセスし調査します。
- Query Service: SQL を使用してデータセットにアクセスし調査します。大量のデータを処理する際に、データアクセスのオーバーヘッドが低くなります。
- Sensei ML Framework: データのトレーニングおよびスコアリング機能を備え、1 回のクリックでレシピを作成できるモデル開発。
- Experience Data Model (XDM): 標準化と相互運用性は、Adobe Experience Platform を支える重要な概念です。アドビが推進するエクスペリエンスデータモデル(XDM)は、カスタマーエクスペリエンスデータを標準化し、カスタマーエクスペリエンス(顧客体験)管理のスキーマを定義する取り組みです。
主な機能と一般的な操作
JupyterLab の主な機能と、一般的な操作を実行する手順について以下の節で説明します。
JupyterLab へのアクセス access-jupyterlab
Adobe Experience Platform で、左側のナビゲーションの ノートブック を選択します。 JupyterLab が完全に初期化されるまでしばらく待ちます。
JupyterLab インターフェイス jupyterlab-interface
JupyterLab インターフェイスは、メニューバー、折りたたみ可能な左サイドバー、および「ドキュメント」タブと「アクティビティ」タブを含んだメイン作業領域で構成されます。
メニューバー
インターフェイスの上部にあるメニューバーには、JupyterLab で使用可能なアクションをキーボードショートカットで公開する最上位のメニューがあります。
- ファイル:ファイルとディレクトリに関連するアクション
- 編集:編集に関するアクションおよびドキュメントのアクティビティ
- 表示:JupyterLab の外観を変更するアクション
- 実行:ノートブックやコードコンソールなど、異なるアクティビティでコードを実行するアクション
- カーネル :カーネル管理のアクション
- タブ:開いているドキュメントとアクティビティのリスト
- 設定:共通設定と詳細設定エディター
- ヘルプ:JupyterLab とカーネルのヘルプリンクのリスト
左サイドバー
左側のサイドバーには、次の機能にアクセスできるクリック可能なタブが含まれています。
- ファイルブラウザー:保存されたノートブックドキュメントとディレクトリのリスト
- データエクスプローラー:データセットとスキーマ
- カーネルとターミナルの実行:終了する機能を持つアクティブなカーネルとターミナルセッションのリスト
- コマンド:便利なコマンドのリスト
- セルインスペクター :プレゼンテーション用にノートブックを設定する際に役立つツールやメタデータにアクセスできるセルエディター。
- タブ:開いたタブのリスト
タブを選択してその機能を表示するか、展開されたタブを選択して、以下に示すように左側のサイドバーを折りたたみます。
メイン作業領域
JupyterLab のメインの作業領域では、ドキュメントやその他のアクティビティを、サイズ変更または分割可能なタブのパネルに配置できます。タブをタブパネルの中央にドラッグして、タブを移行します。タブをパネルの左、右、上または下にドラッグして、パネルを分割します。
Python/R での GPU とメモリサーバーの設定
JupyterLab で、右上隅の歯車アイコンを選択して、Notebook サーバー設定 を開きます。GPU をオンに切り替えたり、スライダーを使用して必要な量のメモリを割り当てたりできます。割り当てることができるメモリの量は、組織がプロビジョニングした量によって異なります。 「設定を更新」を選択して保存します。
JupyterLab の終了と再起動
JupyterLab では、それ以上リソースを使用しないよう、セッションを終了することができます。電源アイコン を選択して開始し、表示されるポップオーバーから「シャットダウン」を選択してセッションを終了します。Notebook セッションは、12 時間操作がないと自動的に終了します。
JupyterLab を再起動するには、電源アイコンのすぐ左にある 再起動アイコン を選択し、表示されるポップオーバーから「再起動」を選択します。
コードセル code-cells
コードセルは、ノートブックの主なコンテンツです。これらには、ノートブックの関連カーネルの言語のソースコードと、コードセルを実行した結果の出力が含まれています。実行回数は、実行順序を表す各コードセルの右側に表示されます。
一般的なセルのアクションを以下に示します。
-
セルの追加:ノートブックメニューのプラス記号(+)をクリックして、空のセルを追加します。新しいセルは、現在操作中のセルの下に配置されます。特定のセルにフォーカスがない場合は、ノートブックの最後に配置されます。
-
セルの移動:移動するセルの右側にカーソルを置き、セルをクリックして新しい位置にドラッグします。また、あるノートブックから別のノートブックにセルを移動すると、セルとその内容が複製されます。
-
セルの実行:実行するセルのボディをクリックし、ノートブックメニューの 再生 アイコン(▶)をクリックします。カーネルが実行を処理する際には、セルの実行カウンターにアスタリスク(*)が表示され、完了時には整数に置き換えられます。
-
セルの削除:削除するセルのボディをクリックし、はさみ アイコンをクリックします。
カーネル kernels
ノートのカーネルは、ノートのセルを処理するための言語固有のコンピューティングエンジンです。Python に加えて、JupyterLab は R、PySpark、Spark(Scala)で追加の言語サポートを提供します。ノートブックドキュメントを開くと、関連するカーネルが起動します。ノートブックセルが実行されると、カーネルは計算をおこない、結果を生成し、CPU やメモリリソースを大量に消費する可能性があります。割り当てられたメモリは、カーネルがシャットダウンされるまで解放されません。
特定の機能は、以下の表で説明するように、特定のカーネルに限定されています。
- Sensei ML Framework
- Catalog Service
- Query Service
- Sensei ML Framework
- Catalog Service
- Sensei ML Framework
- Catalog Service
カーネルセッション kernel-sessions
JupyterLab のアクティブなノートブックまたはアクティビティはそれぞれ、カーネルセッションを使用します。すべてのアクティブなセッションは、左側のサイドバーから「実行中の端末とカーネル」タブを展開すると見つかります。ノートブックのカーネルのタイプと状態は、ノートブックのインターフェースの右上を見ることで識別できます。下の図では、ノートブックに関連するカーネルは Python3 で、現在の状態は右側に灰色の円で表されています。白い円はアイドルカーネル、黒い円はビジーカーネルを意味します。
カーネルが長期間シャットダウンされている、非アクティブとなっている場合、カーネルがありません。 が実円と表示されます。カーネルの状態をクリックし、以下に示すように適切なカーネルタイプを選択して、カーネルをアクティブにします。
ランチャー launcher
カスタマイズされた Launcher は、次のような、サポートされているカーネル用の便利なノートブックテンプレートを提供し、タスクを開始するのに役立ちます。
一部のノートブックテンプレートは、特定のカーネルに限定されています。各カーネルのテンプレートの可用性は、次の表にマッピングされます。
新しい ランチャー を開くには、ファイル/新規ランチャー をクリックします。または、左のサイドバーで ファイルブラウザー を展開し、プラス記号(+)をクリックします。
次の手順
サポートされている各ノートブックの詳細と使用方法については、Jupyterlab ノートブックのデータアクセス開発者ガイドを確認してください。このガイドでは、JupyterLab ノートブックを使用して、データの読み取りや、書き込み、クエリなど、データへのアクセスを行う方法を中心に取り上げています。 また、このデータアクセスガイドには、サポートされている各ノートブックで読み取り可能なデータの最大量に関する情報も含まれています。
サポートされるライブラリ supported-libraries
Python、R、PySpark でサポートされているパッケージのリストについては、!conda list
をコピーして新しいセルに貼り付け、そのセルを実行します。 サポートされているパッケージのリストが、アルファベット順に表示されます。
さらに、次の依存関係が使用されますが、一覧には表示されません。
- CUDA 11.2
- CUDNN 8.1