Data Science Workspace UI でのモデルのトレーニングと評価

Adobe Experience Platform Data Science Workspace では、モデルの意図に適した既存のレシピを組み込むことで、機械学習モデルが作成されます。次に、モデルに関連するハイパーパラメーターを微調整することで、モデルの動作効率と有効性を最適化するようにトレーニングおよび評価します。レシピは再利用可能で、複数のモデルを作成し、単一のレシピで特定の目的に合わせてカスタマイズできます。

このチュートリアルでは、モデルの作成、トレーニング、評価の手順について説明します。

はじめに

このチュートリアルを完了するには、Experience Platform へのアクセス権が必要です。 Experience Platform の組織にアクセスする権限がない場合は、続行する前にシステム管理者に問い合わせてください。

このチュートリアルでは、既存のレシピが必要です。レシピがない場合は、先に進む前に、「UI へのパッケージレシピの読み込み」チュートリアルに従ってください。

モデルの作成

Experience Platformで、左側のナビゲーションにある「モデル」タブを選択し、「参照」タブを選択して既存のモデルを表示します。 ページ右上付近の モデルを作成 を選択して、モデル作成プロセスを開始します。

既存のレシピのリストを参照し、モデルの作成に使用するレシピを見つけて選択し、「次へ」を選択します。

適切な入力データセットを選択して、「次へ」を選択します。 これにより、モデルのデフォルトの入力トレーニングデータセットが設定されます。

モデルの名前を指定し、デフォルトのモデル設定を確認します。レシピの作成時にデフォルト設定が適用され、値をダブルクリックして設定値を確認および変更しました。

設定の新しいセットを指定するには、「新しい設定をアップロード を選択し、モデル設定を含む JSON ファイルをブラウザーウィンドウにドラッグします。 「終了」を選択して、モデルを作成します。

NOTE
コンフィギュレーションは、意図したレシピに固有で固有です。つまり、小売販売レシピのコンフィギュレーションは、商品のRecommendationsレシピでは機能しません。 小売販売レシピ設定のリストについては「リファレンス」の節を照してください。

トレーニング実行の作成

Experience Platformで、左側のナビゲーションにある「モデル」タブを選択し、「参照」タブを選択して既存のモデルを表示します。 トレーニングするモデルの名前に付けられたハイパーリンクを検索して選択します。

既存のトレーニング実行と現在のトレーニングステータスが表示されます。Data Science Workspace ユーザーインターフェイスを使用して作成されたモデルの場合、トレーニング実行は、デフォルト設定と入力トレーニングデータセットを使用して、自動的に生成および実行されます。

モデルの概要ページの右上付近にある トレーニング を選択して、新しいトレーニング実行を作成します。

トレーニング実行のトレーニング入力データセットを選択し、「次へ」を選択します。

モデルの作成時に提供されたデフォルトの設定が表示されるので、値をダブルクリックして変更および修正します。終了 を選択し、トレーニング実行を作成して実行します。

NOTE
コンフィギュレーションは、意図したレシピに固有で固有です。つまり、小売販売レシピのコンフィギュレーションは、商品のRecommendationsレシピでは機能しません。 小売販売レシピ設定のリストについては「リファレンス」の節を照してください。

モデルの評価

Experience Platformで、左側のナビゲーションにある「モデル」タブを選択し、「参照」タブを選択して既存のモデルを表示します。 評価するモデルの名前にアタッチされているハイパーリンクを探して選択します。

モデルを選択

既存のトレーニング実行と現在のトレーニングステータスが表示されます。完了したトレーニング実行が複数ある場合、モデル評価グラフで、様々なトレーニング実行にわたって評価指標を比較できます。 グラフ上のドロップダウンリストを使用して、評価指標を選択します。

絶対百分率誤差(MAPE)指標は、精度をエラーに対する割合で表します。これは、パフォーマンスが最も高い実験を特定するために使用されます。MAPE が低いほど、より良い結果が得られます。

トレーニング実行の概要

「精度」指標は、取得された ​インスタンスの合計と比較した、関連するインスタンスの割合を示します。精度は、ランダムに選択した結果が正しい確率と見なすことができます。

複数の実行の実行

特定のトレーニング実行を選択すると、評価ページを開いて、その実行の詳細が表示されます。 これは、実行が完了する前でも実行できます。評価ページでは、トレーニング実行に固有の、その他の評価指標、設定パラメーターおよびビジュアライゼーションを表示できます。

ログをプレビュー

また、実行の詳細を確認するアクティビティログをダウンロードすることもできます。ログは、失敗した実行で何が起きたかを確認するのに特に役立ちます。

アクティビティログ

ハイパーパラメーターはトレーニングできず、異なる組み合わせのハイパーパラメーターをテストすることでモデルを最適化する必要があります。最適化されたモデルに到達するまで、このモデルのトレーニングと評価のプロセスを繰り返します。

次の手順

このチュートリアルでは、Data Science Workspace でのモデルの作成、トレーニング、評価について順を追って説明しました。 最適モデルに到達したら、「UI でのモデルのスコア付け」チュートリアルに従って、訓練済みモデルを使用して洞察を生成できます。

リファレンス reference

小売販売レシピの設定

ハイパーパラメーターは、モデルのトレーニング動作を決定します。ハイパーパラメーターを修正すると、モデルの精度と精度に影響を与えます。

Hyperparameter
説明
推奨範囲
learning_rate
学習率は、learning_rate によって各ツリーの貢献度を減らします。Learning_rate と n_estimators の間にトレードオフがあります。
0.1
n_estimators
実行するブースティングステージの数。勾配ブースティングは、過学習に対してかなり強力なので、通常、大きな数値を指定するとパフォーマンスが向上します。
100
max_depth
個々の回帰予測の最大深さ。最大の深さは、ツリー内のノード数を制限します。最高のパフォーマンスを得るには、このパラメーターを調整します。最適な値は、入力変数の操作に依存します。
3

他のパラメーターは、モデルの技術的特性を決定します。

パラメーターキー
タイプ
説明
ACP_DSW_INPUT_FEATURES
文字列
コンマ区切りの入力スキーマ属性のリスト
ACP_DSW_TARGET_FEATURES
文字列
コンマ区切りの出力スキーマ属性のリスト
ACP_DSW_FEATURE_UPDATE_SUPPORT
Boolean
入出力機能が変更可能かどうかを特定します。
tenantId
文字列
この ID により、作成したリソースの名前空間が適切に設定され、組織内に含まれるようになります。 テナント ID を検索するには、こちらの手順に従います。
ACP_DSW_TRAINING_XDM_SCHEMA
文字列
モデルのトレーニングに使用する入力スキーマ。
evaluation.labelColumn
文字列
評価のビジュアライゼーションの列ラベル
evaluation.metrics
文字列
モデルの評価に使用される評価指標のカンマ区切りのリスト
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA
文字列
モデルのスコアリングに使用される出力スキーマ。
recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9