AI モデルを監視する ai-model-observability

マーケター、データサイエンティスト、意思決定管理者のいずれであっても、パーソナライズされた最適化モデルのパフォーマンスと行動を把握することで、AIを活用して、顧客一人ひとりに最適なオファーを選択することができます。

これを行うには、Journey OptimizerでAI モデルの正常性、トレーニング状態、進化を直接監視できます。

これにより、モデルが機能しているかどうか、最後にトレーニングされたとき、トレーニング中に何が起こったのか、ビジネス成果(コンバージョンや収益など)をどのように促進しているのか、そしてモデルが機能していないときにトラブルシューティングするのかを明確に把握できます

AVAILABILITY
現在、この機能は​ パーソナライズされた最適化 モデルでのみサポートされています。

➡️ この機能をビデオで確認

トレーニングステータスの表示 from-ai-model-list

モデルが公開されると、継続的なライフサイクルに入ります。データが収集され、モデルが定期的に再訓練されて、オファーのランキングが最適化されます。 パーソナライズされた最適化モデルのトレーニング状況は、AI モデルリストで確認できます。

  1. Decisioning > 戦略設定 > AI モデル​に移動して、AI モデルインベントリを開きます。

  2. 利用可能なすべてのAI モデルとそのステータスを表示できます。

  3. パーソナライズされた最適化タイプの​Live AI モデルごとに、次の2つの列が表示されます。

    • 前回のトレーニングジョブが実行された場合(前回のトレーニング)、および
    • 各モデルが正常にトレーニングされたかどうか(トレーニング結果)。

    これにより、さらなる調査やトラブルシューティングが必要なモデルを素早く特定できます。

モデルステータスレポートへのアクセス access-ai-model-details

リストからパーソナライズされた最適化AI モデルをクリックします。 そこから、以下に示す要素を表示できます。

  • 現在デプロイされているモデル – このセクションには、現在デプロイされているモデル、デプロイされた日時、使用するデータの日付範囲、追加およびパーソナライズされている決定項目(オファー)の数、サブモデル間の現在のトラフィック配分が表示されます。

    この例では、モデルは5つの決定項目でトレーニングされ、モデルには3つの決定項目についてパーソナライズされた予測を作成するのに十分なトラフィックがあります。 残りの2つの決定項目はランダムに提供されます。

    また、このモデルでは現在、パーソナライズされたニューラルネットワークに対するトラフィックの40%、コンテキストに基づくバンディットに対するトラフィックの40%、ランダムな探索に対するトラフィックの20%を割り当てています。

  • 前回のトレーニング ジョブ – このセクションには、前回のトレーニング ジョブのステータス、実行時、およびエラーメッセージが表示されます。 ​ エラー状態について詳しく見る

    この例では、デプロイされたモデルが想定どおりにトレーニングジョブと一致することが確認できます。

  • プロパティ – このセクションには、使用されるデータセット、最適化指標、パーソナライズされた最適化モデルのトレーニングに使用されるオーディエンスなど、モデルのプロパティが表示されます。

    プロパティを編集​をクリックして、これらの要素を変更します。 AI モデルの作成画面にリダイレクトされます。 詳細情報

  • Model performance – このセクションでは、各サブモデルのトラフィック配分やコンバージョン率など、モデルの各アームのパフォーマンスを経時的に示します。 過去7日間​と​ 過去30日間 ​を切り替えることができます。 上昇率と統計的有意性は、モデルが実際にマーケティング成果を向上させるかどうかを判断するための重要な指標です。

    この例では、過去30日間で、パーソナライズされたサブモデルはコンバージョン率を60%以上向上させ、この上昇は統計的に有意です。つまり、このAI モデルがビジネスにインパクトを与えていることがわかります。

  • モデルのトラフィック配分 – このセクションでは、モデルが時間の経過とともにどのように進化してきたかを示します。 モデルが最初にデプロイされた場合、オファーデータがまだ収集されていないため、トラフィックの100%はランダムです。 最初のリトレーニングの後、トラフィックは通常、パーソナライズされたアームに移行します。

    この例では、モデルが時間をかけて再訓練されたため、トラフィック配分が100% ランダム探索からニューラルネットワークとコンテクスト型バンディットトラフィックに移行したことがわかります。

トレーニングエラーについて check-for-error-states

前回のトレーニングジョブが失敗したパーソナライズされた最適化AI モデルのエラーの詳細を表示するには、次の手順に従います。

  1. リストからモデルをクリックします。 モデルのステータスの詳細が表示されます。

    {width="95%"}

    この例では、最後のトレーニングジョブが失敗したため、モデルがデプロイされていないことがわかります。

    note
    NOTE
    モデルがデプロイされていない場合、決定リクエストは均一なランダムトラフィック割り当てを使用して提供されます。
  2. 最後のトレーニングジョブ」セクションでエラーの詳細を確認します。

    {width="70%"}

    通常、このモデルに対して選択したデータセットにフィードバックイベントがない場合、トレーニングジョブは失敗します。 つまり、データセットにデータを入力するか、適切なコンバージョンイベントを含む新しいデータセットを選択する必要があります。

  3. モデルの​ プロパティ ​で選択されているデータセットを確認できます。 「プロパティを編集」をクリックして、別のデータセットを選択します。 詳細情報

    {align="center" width="45%"}

よくある質問 faq

どのAI モデルを監視できますか?
AI モデルの監視は、現在、​ パーソナライズされた最適化 モデルでのみサポートされています。 その他のランキングモデルタイプでは、モデルステータスレポートがまだ公開されていません。
モデルのトレーニングジョブが失敗した理由
モデルに選択したデータセットにフィードバック(コンバージョン)イベントがない、またはほとんど発生しない場合、トレーニングジョブが失敗することがよくあります。 エラーの詳細については、最後のトレーニングジョブ セクションを確認し、モデルの​ プロパティ ​を確認して、データセットと最適化指標を確認します。 データセットに適切なイベントを入力するか、適切なコンバージョンデータを含む別のデータセット 選択します。
AI モデルのモニタリングは、キャンペーンレポートとジャーニーレポートにどのように関連していますか?
AI モデルによるモニタリングは、キャンペーンレポートやジャーニーレポートとは異なります。 単一のAI モデルは、複数のキャンペーンまたは複数のジャーニーで使用でき、キャンペーンやジャーニーのレポートには、特定の配信に使用されたモデルが表示されません。 AI モデルのステータスの監視を使用して、モデル自体を把握および監視します。配信レベルの指標には、​ キャンペーンレポート ​​ ジャーニーレポート ​を使用します。
最適化指標は、売上や注文額などの連続指標であり、クリック数やコンバージョンなどのバイナリ指標ではありません。 報告されたコンバージョンとコンバージョン率の値はどのように解釈できますか?
売上や注文額などの連続指標を使用する場合、モデルはオファーの表示に関連する推定値を予測しようとします(コンバージョンの可能性ではありません)。 報告された「コンバージョン」値は、各モデルアームの記録されたオファー表示に関連付けられた合計収益(または注文値)です。 報告された「コンバージョン率」は、コンバージョン値を表示値で割った値であり、連続指標の場合は100%を超える可能性があります。
リフトの重要性は何ですか?
上昇率は、報告された上昇率とランダム探索の統計的有意性です。 有意性は比例差のカイ二乗検定を使用して計算され、2つの母集団の比率に対するZ検定の有意性計算と同じ結果が得られます。
モデル Gini インデックスとは何ですか? ジニ指数の「良い」値とは何ですか?
モデルジニ指数(ジニ係数とも呼ばれる)は、モデルの予測力をオフラインで測定する指標です。 モデルのGini インデックスの範囲は0 (予測力なし)から1 (すべての顧客に対する各オファーのコンバージョンまたは指標の値を完全に予測)です。 Gini インデックスの値は普遍的な「良い」値はありません。決定のユースケースが異なれば、ユーザーの動作も異なるため、モデルの結果も異なります。 同じユースケース内で、高いGini インデックス値は、より高品質のモデルを示します。
ジニ指数はどのように計算されますか?

各モデルアームのGini インデックスは、最適化指標がバイナリであるか連続しているかに応じて異なる計算されます。

バイナリ最適化指標 (クリック数、注文数など): Gini インデックスは、通常はROC AUCまたは簡単にAUCと呼ばれる、受信者 – 操作特性(ROC)曲線の曲線(AUC)下の領域(AUC)に基づいて計算されます。 ROC AUCの範囲は、0.5 (予測力がゼロのランダムモデル)から1.0 (完全予測力)です。 ROC AUCは、Gini = 2 x (ROC AUC) - 1という式を使用してGini インデックスに変換されます。

継続的最適化指標 (収益、注文値など): ジニ指数は、モデルの累積予測陽性対母集団の累積真の陽性値に関連するローレンツ曲線の下の領域に基づいて計算されます。 ローレンツ曲線の下の領域は0.0 (完全な予測力)から0.5 (予測力がゼロのランダムモデル)の範囲です。 Lorenz AUCは、Gini = 1 - 2 x (Lorenz AUC)という式を使用してGini インデックスに変換されます。

モデル品質のより良い尺度は何ですか:ジニ指数またはリフト/リフトの有意性?
一般的に、リフトやリフトの有意性などのモデル品質のオンライン測定は、モデル品質を測定するための「ゴールドスタンダード」手法と見なされます。 ジニ指数は、意思決定モデルを評価する顧客データサイエンスチームに追加のデータポイントを提供すると報告されています。

チュートリアルビデオ video

AI ランキング モデルを監視し、Journey Optimizerでトレーニングの状態とパフォーマンスを解釈する方法について説明します。

recommendation-more-help
journey-optimizer-help