AI モデルの監視 ai-model-observability

マーケター、データサイエンティスト、意思決定管理者のいずれであっても、パーソナライズされた最適化モデルのパフォーマンスと動作を理解することで、AI を使用して各顧客に最適なオファーを選択できます。

それには、AI モデルのヘルス、トレーニングステータスおよび進化を Journey Optimizer で直接監視できます。

これにより、モデルが機能しているかどうか、最後にトレーニングされたとき、トレーニング中に何が起こったか、ビジネス成果を促進している方法(コンバージョンや売上高など)、機能していないときのトラブルシューティングを明確に把握でき す。

AVAILABILITY
現在、この機能は、​ パーソナライズされた最適化 ​ モデルでのみサポートされています。

➡️ この機能をビデオで確認

トレーニングステータスの表示 from-ai-model-list

モデルが運用を開始するように設定されると、継続的なライフサイクルが開始されます。データが収集され、オファーのランキングを最適化するためにモデルが定期的に再トレーニングされます。 パーソナライズされた最適化モデルのトレーニングステータスは、AI モデルリストで確認できます。

  1. 決定 / 戦略設定 / AI モデル に移動して、AI モデルインベントリを開きます。

  2. 使用可能なすべての AI モデルとそのステータスが表示されます。

  3. パーソナライズされた最適化タイプの ライブ AI モデルごとに、2 つの列が表示されます。

    • 最後のトレーニングジョブが実行された日時(最後のトレーニング
    • 各モデルが正常にトレーニングされたかどうか(トレーニング結果)。

    これにより、さらに調査やトラブルシューティングが必要なモデルをすばやく特定できます。

モデルステータスレポートへのアクセス access-ai-model-details

リストからパーソナライズされた最適化 AI モデルをクリックします。 ここから、以下にリストされている要素を表示できます。

  • 現在デプロイされているモデル – このセクションには、現在デプロイされているモデル、デプロイ日時、使用するデータの日付範囲、含まれてパーソナライズされている決定項目(オファー)の数、サブモデル間の現在のトラフィック配分が表示されます

    この例では、モデルは 5 つの決定項目に基づいてトレーニングされ、モデルには、3 つの決定項目に対するパーソナライズされた予測を開発するのに十分なトラフィックがあります。 残りの 2 つの決定項目は、ランダムに提供されます。

    また、モデルでは現在、トラフィックの 40% をパーソナライズされたニューラルネットワークに、トラフィックの 40% をコンテキストバンディットに、トラフィックの 20% をランダム探索に割り当てています。

  • 前回のトレーニングジョブ – このセクションには、前回のトレーニングジョブのステータス、実行日時およびエラーメッセージが表示されます。 ​ エラー状態の詳細 ​

    この例では、デプロイしたモデルが期待どおりにトレーニングジョブに一致することを確認できます。

  • プロパティ – このセクションでは、使用されるデータセット、最適化指標、パーソナライズされた最適化モデルのトレーニングに使用されるオーディエンスなど、モデルのプロパティを表示します。

    プロパティを編集 をクリックして、これらの要素を変更します。 AI モデルを作成画面にリダイレクトされます。 詳細情報

  • Model performance – このセクションでは、トラフィック配分や各サブモデルのコンバージョン率など、モデルの各アームのパフォーマンスの推移を表示します。 過去 7 日間過去 30 日間 を切り替えることができます。 上昇率と統計的優位差は、モデルが実際にマーケティング成果を向上させているかどうかを示す主な指標です。

    この例では、過去 30 日間に、パーソナライズされたサブモデルによってコンバージョン率が 60% 以上増加しており、この増加は統計的に有意な増加であり、この AI モデルがビジネスに影響を与えていることがわかります。

  • モデルトラフィック配分の推移 – このセクションでは、モデルが時間の経過と共にどのように進化したかを示します。 オファーデータがまだ収集されていないので、モデルを最初にデプロイすると、トラフィックの 100% がランダムになります。 最初の再トレーニング後、トラフィックは通常、パーソナライズされたアームに移動します。

    この例では、モデルが時間の経過と共に再トレーニングされたため、トラフィックの割り当てが 100% のランダムな探索からニューラルネットワークとコンテキストバンディットトラフィックにシフトしていることがわかります。

トレーニングエラーについて check-for-error-states

前回のトレーニングジョブが失敗した、パーソナライズされた最適化 AI モデルのエラーの詳細を表示するには、次の手順に従います。

  1. リストからモデルをクリックします。 モデルのステータスの詳細が表示されます。

    {width="95%"}

    この例では、最後のトレーニングジョブが失敗したので、モデルがデプロイされていないことを確認できます。

    note note
    NOTE
    モデルがデプロイされていない場合、決定リクエストは、均一なランダムトラフィック配分を使用して提供されます。
  2. 前回のトレーニングジョブ セクションで、エラーの詳細を確認します。

    {width="70%"}

    通常、トレーニングジョブは、このモデル用に選択したデータセットにフィードバックイベントがない場合に失敗します。 つまり、データセットにデータを入力するか、適切なコンバージョンイベントを持つ新しいデータセットを選択する必要があります。

  3. モデルの プロパティ で、どのデータセットが選択されているかを確認できます。 プロパティを編集 をクリックして、別のデータセットを選択します。 詳細情報

    {width="45%"}

よくある質問 faq

どの AI モデルを監視できますか?
AI モデルの監視は、現在、​ パーソナライズされた最適化 ​ モデルでのみサポートされています。 その他のランキングモデルタイプでは、まだモデルのステータスレポートが公開されていません。
モデルのトレーニングジョブが失敗した理由
モデルに対して選択したデータセットにフィードバック(コンバージョン)イベントがない、または非常に少ない場合、トレーニングジョブが失敗することがよくあります。 前回のトレーニングジョブ セクションでエラーの詳細を確認したら、モデルの プロパティ を確認して、データセットと最適化指標を確認します。 データセットに適切なイベントを入力するか、適切なコンバージョンデータを ​ 別のデータセットを選択 ​ します。
AI モデルの監視は、キャンペーンレポートやジャーニーレポートにどのように関連しますか?
AI モデルの監視は、キャンペーンレポートやジャーニーレポートとは異なります。 単一の AI モデルは複数のキャンペーンまたは複数のジャーニーで使用でき、キャンペーンレポートまたはジャーニーレポートには、特定の配信に使用されたモデルが表示されません。 AI モデルのステータス監視を使用すると、モデル自体を把握および監視できます。配信レベルの指標には、​ キャンペーンレポート ​ および ​ ジャーニーレポート ​ を使用します。
最適化指標は、売上高や注文値などの連続的な指標であり、クリック数やコンバージョン数などのバイナリ指標ではありません。 レポートされたコンバージョン数とコンバージョン率の値はどのように解釈されますか。
売上高や注文値などの連続した指標を使用する場合、モデルは、(コンバージョンの確率ではなく)特定のオファーの提示に関連する予測値の予測を試みます。 レポートされる「コンバージョン」値は、各モデルアームについて記録されたオファー表示に関連付けられた合計売上高(または注文値)です。 報告された「コンバージョン率」は、コンバージョン値をディスプレイ値で割った値です。連続した指標の場合は 100% を超える可能性があります。
上昇率の重要度とは
上昇率有意差は、報告された上昇率対ランダム探索の統計的有意差です。 有意性は、比率差のカイ 2 乗検定を使用して計算され、2 つの母集団比率に対する Z 検定の有意性計算と同じ結果が得られます。
モデルの Gini インデックスは何ですか? Gini インデックスの「良い」値とは何ですか?
モデルの Gini インデックス(Gini 係数とも呼ばれます)は、モデルの予測力を示すオフラインの指標です。 モデル Gini インデックスの範囲は 0 (予測力なし)から 1 です(すべての顧客のすべてのオファーのコンバージョン値または指標値を完全に予測します)。 意思決定のユースケースが異なるとユーザーの行動も異なり、したがってモデルの結果も異なるので、普遍的な「良い」ジニインデックス値はありません。 同じユースケース内で、ジニ インデックスの値が高いほど、モデルの品質が高いことを示します。
Gini インデックスはどのように計算されますか?

最適化指標がバイナリか連続かに応じて、各モデルアームのジニ インデックスの計算方法が異なります。

バイナリ最適化指標 (クリック数、注文数など):Gini インデックスは、受信者動作特性(ROC)曲線の曲線下面積(AUC)に基づいて計算されます。通常、ROC AUC または単に AUC と呼ばれます。 ROC AUC は 0.5 (予測電力ゼロのランダムモデル)から 1.0 (完全予測電力)の範囲です。 ROC AUC は、Gini = 2 x (ROC AUC) - 1 の式を使用して Gini インデックスに変換されます。

連続最適化指標 (売上高、注文値など):ジニ指数は、母集団におけるモデルの累積的な予測陽性と累積的な真陽性に関連するローレンツ曲線の下の領域に基づいて計算されます。 ローレンツ曲線の下の領域は、0.0 (完全予測電力)から 0.5 (予測電力ゼロのランダムモデル)の範囲です。 Gini = 1 - 2 x (Lorenz AUC)の式を使用して、Lorenz AUC を Gini インデックスに変換します。

モデルの品質を測定する場合、ジニ指数と上昇率/上昇率の重要度ではどちらが優れていますか?
通常、上昇率や上昇率有意差などのモデル品質のオンライン測定は、モデル品質を測定するための「ゴールドスタンダード」手法と見なされます。 Gini インデックスは、意思決定モデルを評価する顧客データサイエンスチームに追加のデータポイントを提供するように報告されています。

チュートリアルビデオ video

AI ランキングモデルを監視し、トレーニングのステータスとパフォーマンスを Journey Optimizer で解釈する方法について説明します。

recommendation-more-help
b22c9c5d-9208-48f4-b874-1cefb8df4d76