パーソナライズされた最適化モデル personalized-optimization-model
概要 overview
自動パーソナライゼーションでは監視された機械学習とディープラーニングの最先端のテクノロジーを活用することで、ビジネスユーザー(マーケター)はビジネス目標を定義し、顧客データを利用してビジネス指向モデルをトレーニングし、パーソナライズされたオファーを提供して KPI を最大化することができます。
主なモデルの前提と制限事項 key
自動パーソナライゼーションを使用する利点を最大限に活かすために、いくつかの主な前提と制限事項に注意する必要があります。
- ユーザーが検討中のオファー間で様々な環境設定を使用できるよう、オファーは十分に異なります。オファーが類似しすぎる場合、応答が一見ランダムに見えるので、結果として得られるモデルの影響は少なくなります。例えば、銀行に色の違いのみがある 2 つのクレジットカードオファーがある場合、どのカードを推奨するかは問題になりませんが、各カードの条件が異なる場合、これは特定の顧客が 1 つを選択する理由の根拠となり、より影響力のあるモデルを作成するのに十分なオファー間の違いが得られます。
- ユーザートラフィックの構成が安定しています。モデルのトレーニングと予測中にユーザートラフィックの構成が大幅に変化すると、モデルのパフォーマンスが低下する可能性があります。例えば、モデルのトレーニングフェーズで、オーディエンス A のユーザーのデータしか利用できない場合、トレーニング済みのモデルを使用してオーディエンス B のユーザーの予測を生成すると、モデルのパフォーマンスに影響する可能性があります。
- オファーのパフォーマンスは短期間に大幅に変化するものではありません。このモデルは毎週更新され、モデルの更新に伴ってパフォーマンスの変化が伝えられます。例えば、ある製品は以前は非常に人気がありましたが、公開レポートでその製品が健康に有害であることが特定されると、急速に人気がなくなりました。このシナリオでは、ユーザーの行動の変化でモデルが更新されるまで、モデルは引き続きこの製品を予測できます。
仕組み how
モデルでは、オファー、ユーザー情報およびコンテキスト情報間の複雑な機能インタラクションを学習し、パーソナライズされたオファーをエンドユーザーに推奨します。機能は、モデルへの入力です。
次の 3 種類の機能があります。
このモデルには次の 2 つのフェーズがあります。
- オフラインモデルトレーニング フェーズでは、履歴データで機能インタラクションを学習および記憶することによってモデルをトレーニングします。
- オンライン推論 フェーズでは、モデルで生成されたリアルタイムスコアに基づいて候補オファーをランク付けします。ユーザーやオファーの機能を組み込むのが困難な従来の協調フィルタリング手法とは異なり、自動パーソナライゼーションはディープラーニングベースのレコメンデーション手法であり、複雑な非線形の機能インタラクションパターンを含めて学習できます。
以下に、自動パーソナライゼーションの基本的な考え方を簡単に示します。図 1 に示すように、ユーザーとオファーとの間の過去のインタラクションを格納するデータセットがあるとします。 次のものがあります。
- 2 つのオファー(offer_1 と offer_2)
- 2 つの機能(feature_1 と feature_2)
- response 列。
feature_1、feature_2 および response の値は 0 または 1 です。図 1 の青いボックスとオレンジ色のボックスを見ると、offer_1 では feature_1 と feature_2 が同じ値の場合は 1、offer_2 では feature_1 が 0、feature_2 が 1 の場合は response が 1 となる可能性が高くなります。また、赤いボックスでは、feature_1 が 0、feature_2 が 1、response が 0 の場合に offer_1 が提供されることもわかります。オレンジ色のボックスに表示されるパターンに基づいて、 feature_1 が 0 で feature_2 が 1 の場合、 offer_2 の方がおそらくより適したレコメンデーションです。
基本的に、これは、過去の機能インタラクションを学習および記憶し、適用してパーソナライズされた予測を生成する考え方です。
コールドスタートの問題 cold-start
レコメンデーションを行うのに十分なデータがない場合に、コールドスタートの問題が発生します。自動パーソナライゼーションの場合、2 種類のコールドスタートの問題が発生します。
- 履歴データを含まない新しい AI モデルを作成した後、オファーはデータを収集するために一定期間ランダムに提供され、そのデータは最初のモデルのトレーニングに使用されます。
- 最初のモデルがリリースされた後、合計トラフィックの 10%がランダムサービングに割り当てられ、トラフィックの 90%がモデルのレコメンデーションに使用されます。したがって、新しいオファーが AI モデルに追加された場合、そのオファーはトラフィックの 10%の一部として配信されます。モデルは継続的に更新されるので、これらのオファーで収集されたデータによって、トラフィックの 90%の中から選択される回数が決まります。
再トレーニング re-training
最新の機能インタラクションを学習し、モデルパフォーマンスの低下を軽減するために、モデルの再トレーニングが毎週行われます。