Data Science Workspace UIでモデルをトレーニングおよび評価する

Adobe Experience Platform Data Science Workspace では、モデルの意図に適した既存のレシピを組み込むことで、機械学習モデルが作成されます。次に、モデルに関連するハイパーパラメーターを微調整することで、モデルの動作効率と有効性を最適化するようにトレーニングおよび評価します。レシピは再利用可能で、複数のモデルを作成し、単一のレシピで特定の目的に合わせてカスタマイズできます。

このチュートリアルでは、モデルの作成、トレーニング、評価の手順について説明します。

はじめに

このチュートリアルを完了するには、Experience Platformにアクセスできる必要があります。 Experience PlatformのIMS組織にアクセスできない場合は、先に進む前に、システム管理者にお問い合わせください。

このチュートリアルでは、既存のレシピが必要です。レシピがない場合は、先に進む前に、「UI へのパッケージレシピの読み込み」チュートリアルに従ってください。

モデルの作成

Experience Platformで、左側のナビゲーションにある「モデル」タブを選択し、「参照」タブを選択して既存のモデルを表示します。 ページの右上付近にある「モデルを作成」を選択して、モデル作成プロセスを開始します。

既存のレシピのリストを参照し、モデルの作成に使用するレシピを探して選択し、次へ​を選択します。

適切な入力データセットを選択し、「次へ」を選択します。 これにより、モデルのデフォルトの入力トレーニングデータセットが設定されます。

モデルの名前を指定し、デフォルトのモデル設定を確認します。レシピの作成中にデフォルトの設定が適用されています。値をダブルクリックして設定値を確認および変更します。

新しい設定のセットを提供するには、「新しい設定をアップロード」を選択し、モデル設定を含むJSONファイルをブラウザーウィンドウにドラッグします。 [終了]を選択して、モデルを作成します。

メモ

設定は、意図されたレシピに固有です。例えば、「小売販売レシピ」の設定は、「製品レコメンデーションレシピ」に対しては機能しません。小売販売レシピ設定のリストについては「リファレンス」の節を照してください。

トレーニング実行の作成

Experience Platformで、左側のナビゲーションにある「モデル」タブを選択し、「参照」タブを選択して既存のモデルを表示します。 トレーニングするモデルの名前にアタッチされているハイパーリンクを探して選択します。

既存のトレーニング実行と現在のトレーニングステータスが表示されます。Data Science Workspaceユーザーインターフェイスを使用して作成されたモデルの場合、トレーニング実行は自動的に生成され、デフォルトの設定と入力トレーニングデータセットを使用して実行されます。

モデルの概要ページの右上付近にある​トレーニング​を選択して、新しいトレーニングを作成します。

トレーニング実行のトレーニング入力データセットを選択し、次へ​を選択します。

モデルの作成時に提供されたデフォルトの設定が表示されるので、値をダブルクリックして変更および修正します。「完了」を選択して、トレーニングの実行を作成し、実行します。

メモ

設定は、意図されたレシピに固有です。例えば、「小売販売レシピ」の設定は、「製品レコメンデーションレシピ」に対しては機能しません。小売販売レシピ設定のリストについては「リファレンス」の節を照してください。

モデルの評価

Experience Platformで、左側のナビゲーションにある「モデル」タブを選択し、「参照」タブを選択して既存のモデルを表示します。 評価するモデルの名前に付けられたハイパーリンクを探して選択します。

モデルを選択

既存のトレーニング実行と現在のトレーニングステータスが表示されます。複数のトレーニングの実行が完了している場合、モデル評価表で異なるトレーニングの実行間で評価指標を比較できます。グラフの上にあるドロップダウンリストを使用して、評価指標を選択します。

絶対百分率誤差(MAPE)指標は、精度をエラーに対する割合で表します。これは、パフォーマンスが最も高い実験を特定するために使用されます。MAPE が低いほど、より良い結果が得られます。

トレーニングの実施の概要

「精度」指標は、取得された​インスタンスの合計と比較した、関連するインスタンスの割合を示します。精度は、ランダムに選択した結果が正しい確率と見なすことができます。

複数の実行の実行

特定のトレーニング実行を選択すると、評価ページを開いてその実行の詳細が表示されます。 これは、実行が完了する前でも実行できます。評価ページでは、トレーニングの実行に固有のその他の評価指標、設定パラメーターおよびビジュアライゼーションを確認できます。

プレビューログ

また、実行の詳細を確認するアクティビティログをダウンロードすることもできます。ログは、失敗した実行で何が起きたかを確認するのに特に役立ちます。

アクティビティログ

ハイパーパラメーターはトレーニングできず、異なる組み合わせのハイパーパラメーターをテストすることでモデルを最適化する必要があります。最適化されたモデルに到達するまで、このモデルのトレーニングと評価のプロセスを繰り返します。

次の手順

このチュートリアルでは、Data Science Workspaceでモデルを作成、トレーニング、評価する手順を説明しました。 最適モデルに到達したら、「UI でのモデルのスコア付け」チュートリアルに従って、訓練済みモデルを使用して洞察を生成できます。

リファレンス

小売販売レシピの設定

ハイパーパラメーターは、モデルのトレーニング動作を決定します。ハイパーパラメーターを修正すると、モデルの精度と精度に影響を与えます。

Hyperparameter 説明 推奨範囲
learning_rate 学習率は、learning_rate によって各ツリーの貢献度を減らします。Learning_rate と n_estimators の間にトレードオフがあります。 0.1
n_estimators 実行するブースティングステージの数。勾配ブースティングは、過学習に対してかなり強力なので、通常、大きな数値を指定するとパフォーマンスが向上します。 100
max_depth 個々の回帰予測の最大深さ。最大の深さは、ツリー内のノード数を制限します。最高のパフォーマンスを得るには、このパラメーターを調整します。最適な値は、入力変数の操作に依存します。 3

他のパラメーターは、モデルの技術的特性を決定します。

パラメーターキー タイプ 説明
ACP_DSW_INPUT_FEATURES 文字列 コンマ区切りの入力スキーマ属性のリスト
ACP_DSW_TARGET_FEATURES 文字列 コンマ区切りの出力スキーマ属性のリスト
ACP_DSW_FEATURE_UPDATE_SUPPORT Boolean 入出力機能が変更可能かどうかを特定します。
tenantId 文字列 この ID は、作成するリソースの名前空間が適切に設定され、IMS 組織内に含まれるようにします。テナント ID を検索するには、こちらの手順に従います。
ACP_DSW_TRAINING_XDM_SCHEMA 文字列 モデルのトレーニングに使用する入力スキーマ。
evaluation.labelColumn 文字列 評価のビジュアライゼーションの列ラベル
evaluation.metrics 文字列 モデルの評価に使用される評価指標のカンマ区切りのリスト
ACP_DSW_SCORING_RESULTS_XDM_SCHEMA 文字列 モデルのスコアリングに使用される出力スキーマ。

このページ