Data Science Workspace UI でのモデルのトレーニングと評価

NOTE
データサイエンスワークスペースは購入できなくなりました。
このドキュメントは、以前に データ Science ワークスペース の利用資格を持つ既存のお客様を対象としています。

Adobe Experience Platform Data Science Workspace では、モデルの意図に適した既存のレシピを組み込むことで、機械学習モデルが作成されます。次に、モデルに関連するハイパーパラメーターを微調整することで、モデルの動作効率と有効性を最適化するようにトレーニングおよび評価します。レシピは再利用可能で、複数のモデルを作成し、単一のレシピで特定の目的に合わせてカスタマイズできます。

このチュートリアルでは、モデルの作成、トレーニング、評価の手順について説明します。

はじめに

このチュートリアルを完了するには、 Experience Platformへのアクセス権が必要です。 Experience Platform の組織にアクセスできない場合は、続行する前にシステム管理者に問い合わせてください。

このチュートリアルでは、既存のレシピが必要です。レシピがない場合は、先に進む前に、「UI へのパッケージレシピの読み込み」チュートリアルに従ってください。

モデルの作成

Experience Platformで、左側のナビゲーションにある「モデル」タブを選択し、「参照」タブを選択して既存のモデルを表示します。 ページの右上付近にある []​ ​​作成モデル を選択しての作成プロセスを開始します。

既存のレシピのリスト参照、モデルの作成に使用するレシピを見つけて選択し、 次へ ​を選択します。

適切な入力データセットを選択して、「 次へ」を選択します。 これにより、モデルのデフォルトの入力トレーニング データセットが設定されます。

モデルの名前を指定し、デフォルトのモデル設定を確認します。レシピの作成時に設定が適用されたデフォルト、値を重複クリックして設定値を確認および変更します。

新しい構成セットを指定するには、[ 新規構成をアップロード を選択し、モデル構成を含む JSON ファイルをブラウザーウィンドウにドラッグします。 完了 ​を選択してモデルを作成します。

NOTE
設定は一意であり、目的のレシピに固有であるため、小売販売レシピの設定は製品Recommendationsレシピでは機能しません。 小売販売レシピ設定のリストについては「リファレンス」の節を照してください。

トレーニング実行の作成

Experience Platformで、左側のナビゲーションにある「モデル」タブを選択し、「参照」タブを選択して既存のモデルを表示します。 トレーニングするモデルの名前に付けられたハイパーリンクを検索して選択します。

既存のトレーニング実行と現在のトレーニングステータスが表示されます。Data Science Workspace ユーザーインタフェースを使用して作成されたモデルの場合、トレーニング実行が自動的に生成され、デフォルト設定と入力トレーニング データセットを使用して実行されます。

[モデルの概要] ページの右上にある トレーニング を選択して、新しいトレーニングの実行作成ます。

トレーニング実行するトレーニング入力データセットを選択し、[ 次へ] を選択します。

モデルの作成時に提供されたデフォルトの設定が表示されるので、値をダブルクリックして変更および修正します。完了 ​を選択して、トレーニング実行を作成して実行します。

NOTE
設定は一意であり、目的のレシピに固有であるため、小売販売レシピの設定は製品Recommendationsレシピでは機能しません。 小売販売レシピ設定のリストについては「リファレンス」の節を照してください。

モデルの評価

Experience Platformで、左側のナビゲーションにある モデル タブを選択し、参照タブを選択して既存のモデルを表示します。 評価するモデルの名前にアタッチされているハイパーリンクを探して選択します。

モデルを選択

既存のトレーニング実行と現在のトレーニングステータスが表示されます。完了したトレーニング実行が複数ある場合、モデル評価グラフで、様々なトレーニング実行にわたって評価指標を比較できます。 グラフ上のドロップダウンリストを使用して、評価指標を選択します。

絶対百分率誤差(MAPE)指標は、精度をエラーに対する割合で表します。これは、パフォーマンスが最も高い実験を特定するために使用されます。MAPE が低いほど、より良い結果が得られます。

トレーニング実行の概要

「精度」指標は、取得された ​インスタンスの合計と比較した、関連するインスタンスの割合を示します。精度は、ランダムに選択した結果が正しい確率と見なすことができます。

複数の実行の実行

特定のトレーニング実行を選択すると、評価ページを開いてその実行の詳細が表示されます。 これは、実行が完了する前でも実行できます。評価ページでは、トレーニング実行に固有の、その他の評価指標、設定パラメーターおよびビジュアライゼーションを表示できます。

ログをプレビュー

また、実行の詳細を確認するアクティビティログをダウンロードすることもできます。ログは、失敗した実行で何が起きたかを確認するのに特に役立ちます。

アクティビティログ

ハイパーパラメーターはトレーニングできず、異なる組み合わせのハイパーパラメーターをテストすることでモデルを最適化する必要があります。最適化されたモデルに到達するまで、このモデルのトレーニングと評価のプロセスを繰り返します。

次の手順

このチュートリアルでは、 Data Science Workspace でモデルを作成、トレーニングおよび評価する手順を説明しました。 最適モデルに到達したら、「UI でのモデルのスコア付け」チュートリアルに従って、訓練済みモデルを使用して洞察を生成できます。

リファレンス reference

小売販売レシピの設定

ハイパーパラメーターは、モデルのトレーニング動作を決定します。ハイパーパラメーターを修正すると、モデルの精度と精度に影響を与えます。

Hyperparameter
説明
推奨範囲
learning_rate
学習率は、learning_rate によって各ツリーの貢献度を減らします。Learning_rate と n_estimators の間にトレードオフがあります。
0.1
n_estimators
実行するブースティングステージの数。勾配ブースティングは、過学習に対してかなり強力なので、通常、大きな数値を指定するとパフォーマンスが向上します。
100
max_depth
個々の回帰予測の最大深さ。最大の深さは、ツリー内のノード数を制限します。最高のパフォーマンスを得るには、このパラメーターを調整します。最適な値は、入力変数の操作に依存します。
3

他のパラメーターは、モデルの技術的特性を決定します。

パラメーターキー
タイプ
説明
ACP_DSW_INPUT_FEATURES
文字列
コンマ区切りの入力スキーマ属性のリスト
ACP_DSW_TARGET_FEATURES
文字列
コンマ区切りの出力スキーマ属性のリスト
ACP_DSW_FEATURE_UPDATE_SUPPORT
Boolean
入出力機能が変更可能かどうかを特定します。
tenantId
文字列
この ID により、作成したリソースが適切に名前空間化され、組織内に含まれるようになります。 テナント ID を検索するには、こちらの手順に従います。
ACP_DSW_TRAINING_XDM_SCHEMA
文字列
モデルのトレーニングに使用する入力スキーマ。
evaluation.labelColumn
文字列
評価のビジュアライゼーションの列ラベル
evaluation.metrics
文字列
モデルの評価に使用される評価指標のカンマ区切りのリスト
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA
文字列
モデルのスコアリングに使用される出力スキーマ。
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9