マシンラーニングモデルの作成と公開

次のガイドでは、機械学習モデルの作成と公開に必要な手順について説明します。 各セクションには、実行内容の説明と、説明された手順を実行するための UI および API ドキュメントへのリンクが含まれています。

はじめに

このチュートリアルを開始する前に、次の前提条件を満たす必要があります。

  • Adobe Experience Platform へのアクセス。 Experience Platform の組織にアクセスする権限がない場合は、続行する前にシステム管理者に問い合わせてください。

  • すべての Data Science Workspace チュートリアルでは、Luma の傾向モデルを使用します。 手順に従うには、Luma propensty モデルスキーマとデータセットを作成する必要があります。

データを調べてスキーマを理解する

Adobe Experience Platform にログインし、「データセット」を選択して既存のすべてのデータセットをリストし、調査するデータセットを選択します。 この場合、Luma web データ データセットを選択する必要があります。

Luma web データセットを選択

データセットアクティビティページが開き、データセットに関連する情報がリスト表示されます。 右上付近の データセットをプレビュー を選択して、サンプルレコードを調べることができます。 また、選択したデータセットのスキーマを表示することもできます。

Luma web データの表示

右側のパネルでスキーマリンクを選択します。 ポップオーバーが表示され、「スキーマ名」の下のリンクを選択すると、スキーマが新しいタブで開きます。

luma web データスキーマをプレビューする

提供された探索的データ分析(EDA)ノートブックを使用して、データをさらに調査できます。 このノートブックを使用すると、Luma データのパターンを理解し、データのサニティを確認し、予測傾向モデルの関連データをまとめることができます。 探索的データ分析について詳しくは、EDA ドキュメントを参照してください。

Luma 傾向レシピの作成 author-your-model

Data Science Workspace ライフサイクルの主要なコンポーネントには、レシピとモデルのオーサリングが含まれます。 Luma 傾向モデルは、顧客が Luma から製品を購入する傾向が高いかどうかを予測するように設計されています。

Luma の傾向モデルを作成するには、レシピビルダーテンプレートを使用します。 レシピには、特定の問題を解決するように設計された機械学習アルゴリズムとロジックが含まれているため、モデルの基礎となります。 さらに重要な点は、レシピを使用すると、組織全体の機械学習を民主化でき、他のユーザーはコードを書かなくても様々な用途のモデルにアクセスできるようになることです。

JupyterLab ノートブックを使用したモデルの作成チュートリアルに従って、後続のチュートリアルで使用する Luma 傾向モデルレシピを作成します。

外部ソースからのレシピの読み込みとパッケージ化(オプション

Data Science Workspaceで使用するレシピをインポートしてパッケージ化する場合は、ソースファイルをアーカイブファイルにパッケージ化する必要があります。 ソースファイルのレシピへのパッケージ化チュートリアルに従います。 このチュートリアルでは、ソースファイルをレシピにパッケージ化する方法を説明します。これは、レシピを Data Science Workspaceに読み込むための前提条件の手順です。 チュートリアルが完了すると、Azure コンテナレジストリに、対応する画像 URL (アーカイブファイル)と共に Docker 画像が提供されます。

このアーカイブファイルを使用して、UI ワークフローまたは API ワークフローを使用したレシピの読み込みワークフローに従って、Data Science Workspaceでレシピを作成できます。

モデルのトレーニングと評価 train-and-evaluate-your-model

データの準備が整い、レシピの準備が整ったら、機械学習モデルをさらに作成、トレーニング、評価できます。 レシピビルダーを使用する際は、モデルをレシピにパッケージ化する前に、モデルのトレーニング、スコアリングおよび評価が完了している必要があります。

Data Science Workspaceの UI および API を使用して、レシピをモデルとして公開できます。 さらに、ハイパーパラメーターの追加、削除、変更など、モデルの特定の側面をさらに微調整できます。

モデルの作成

UI を使用したモデルの作成について詳しくは、Data Science Workspaceのトレーニングとモデルの評価 UI チュートリアルまたは API チュートリアルを参照してください。 このチュートリアルでは、ハイパーパラメータを作成、トレーニング、および更新してモデルを微調整する方法の例を示します。

NOTE
ハイパーパラメーターは学習できないので、トレーニングを実行する前に割り当てる必要があります。ハイパーパラメータを調整すると、トレーニングしたモデルの精度が変わる場合があります。 モデルの最適化は反復的なプロセスなので、満足のいく評価が得られるまでに複数のトレーニング実行が必要になる場合があります。

モデルのスコアリング score-a-model

モデルの作成と公開の次の手順は、モデルを運用できるようにして、データレイクおよびリアルタイム顧客プロファイルからのインサイトをスコアリングして使用することです。

Data Science Workspaceのスコアリングは、入力データを既存のトレーニング済みモデルにフィードすることで実現できます。 次に、スコアリング結果が保存され、新しいバッチとして指定した出力データセットで表示可能になります。

モデルのスコアリング方法については、モデルのスコアリング UI チュートリアルまたは API チュートリアルを参照してください。

サービスとしてのスコアモデルのPublish

Data Science Workspaceを使用すると、トレーニング済みモデルをサービスとして公開できます。 これにより、組織内のユーザーは、独自のモデルを作成しなくてもデータのスコアを取得できます。

モデルをサービスとして公開する方法については、UI チュートリアルまたは API チュートリアルを参照してください。

サービスの自動トレーニングのスケジュール設定

モデルをサービスとして公開したら、機械学習サービスのスケジュールされたスコアリングとトレーニングの実行を設定できます。 トレーニングとスコアリングプロセスを自動化することで、データ内のパターンに追いつくことで、時間を通じてサービスの効率を維持し、向上させることができます。 Data Science Workspace UI でのモデルのスケジュール設定チュートリアルにアクセスしてください。

NOTE
UI からの自動トレーニングおよびスコアリングのモデルのみをスケジュールできます。

次の手順 next-steps

Adobe Experience Platform Data Science Workspace は、機械学習モデルを作成、評価および活用してデータの予測とインサイトを生み出すためのツールとリソースを提供します。 機械学習のインサイトが Profile 対応データセットに取り込まれると、その同じデータが Profile レコードとして取り込まれ、Adobe Experience Platform Segmentation Service を使用してセグメント化できます。

プロファイルと時系列データが取得されると、リアルタイム顧客プロファイルは、既存のデータと結合して和集合表示を更新する前に、ストリーミングセグメント化と呼ばれる継続的なプロセスを通じて、そのデータをセグメントに含めるか除外するかを自動的に決定します。 その結果、顧客がブランドとやり取りする際に、瞬時に計算を行い、顧客に対して強化された個別的なエクスペリエンスを提供する意思決定を行うことができます。

機械学習のインサイトを活用する方法について詳しくは、 機械学習のインサイトを使用したリアルタイム顧客プロファイルのエンリッチメントのチュートリアルを参照してください。

recommendation-more-help
cc79fe26-64da-411e-a6b9-5b650f53e4e9