ランダムフォレストでは、デシジョンツリーをどのように使用しますか?
デシジョンツリーは効果的な統計ツールになりますが、デメリットもあります。最も大きなデメリットは、データの「オーバーフィッティング」が生じ、1 つのデシジョンツリーで、最初のデシジョンツリーの構築に使用されていない将来のデータの予測精度が悪くなる場合があるという点です。これは、統計学習におけるバイアス/バリアンストレードオフと呼ばれる問題です。ランダムな森は、この過剰な課題を克服するのに役立ちます。 ランダムフォレストは簡単に言うと、同一のデータセットを基に、わずかに違う形で構築されたデシジョンツリーの集合で、「投票」によって単一のデシジョンツリーよりも優れたモデルを生成します。ツリーは、置き換え後の訪問レコードのサブセット(バギングと呼ばれます)をランダムに選択することと、属性のサブセットをランダムに選択することによって構築されます。これにより、フォレストは少し異なるデシジョンツリーで構成されます。 この手法では、ランダムフォレストに構築されたデシジョンツリーにわずかなバリエーションが生まれます。この適度な量のバリエーションを追加することで、アルゴリズムの予測精度が高まります。
Target のパーソナライゼーションアルゴリズムでは、ランダムフォレストをどのように使用しますか。
モデルの構築方法
次の図は、Auto-Target と Automated Personalization のアクティビティでモデルがどのように構築されるかを示したものです。
- Target は、エクスペリエンスやオファーをランダムに提供しながら、訪問者のデータを収集します
- Target が大量のデータにヒットした後、Target は機能エンジニアリングを実行します
- Target は、エクスペリエンスまたはオファーごとにランダムフォレスト モデルを作成します
- モデル Target しきい値の品質スコアを満たしているかどうかを確認します
- Target がモデルを実稼動環境にプッシュして、今後のトラフィックをパーソナライズします
Target は、自動的に収集されるデータと、ユーザーから提供されるカスタムデータを使用して、パーソナライゼーションアルゴリズムを構築します。 このモデルによって、訪問者に表示する最適なエクスペリエンスやオファーが予測されます。通常、エクスペリエンス(Auto-Target アクティビティの場合)またはオファー(Automated Personalization アクティビティの場合)ごとに 1 つのモデルが構築されます。 次に、最も高 Target 予測成功指標(コンバージョン率など)を生成するエクスペリエンスまたはオファーが表示されます。 これらのモデルは、予測に使用する前に、ランダムに割り当てられた訪問を対象にトレーニングをおこなう必要があります。そのため、アクティビティが開始されると、パーソナライゼーションアルゴリズムの準備が整うまで、パーソナライズ対象のグループに入っている訪問者にも複数のエクスペリエンスまたはオファーが配信されます。
各モデルは、アクティビティで使用される前に、訪問者の行動の予測に適していることを確認するために、検証する必要があります。 モデルは、カーブの下の領域(AUC)に基づいて検証されます。 検証が必要なため、パーソナライズされたエクスペリエンスの提供をモデルが開始する正確な時間は、データの詳細に依存します。 トラフィックのプランニングの観点からの目安としては、モデルが有効になるまでには、最低限のコンバージョン数が必要になるのが一般的です。
エクスペリエンスまたはオファーのモデルが有効になると、エクスペリエンスまたはオファー名の左にある時計のアイコンが緑色のチェックボックスに変わります。少なくとも 2 つのエクスペリエンスまたはオファーに有効なモデルがある場合、一部の訪問はパーソナライズされ始めます。
機能変換
データはパーソナライゼーションアルゴリズムに送られる前に、特徴変換がおこなわれます。特徴変換は、パーソナライゼーションモデルで使用するために、トレーニングレコードの収集データを準備する処理です。
特徴変換は属性のタイプによって異なります。属性(データサイエンティストは「特徴」と呼ぶこともあります)は次の 2 種類に大別されます。
- 分類: 分類特徴はカウントできませんが、様々なグループに分類できます。分類特徴には、国、性別、郵便番号などがあります。
- 数値: 数値特徴は測定やカウントが可能で、年齢や収入などがあります。
分類特徴の場合、可能なすべての特徴のセットが保持され、尤度変換を使用してデータサイズが低減されます。数値特性の場合、再スケールによって、機能がボード全体で同等になります。
マルチアームバンディットによる学習とパーソナライズのバランスを取る
Target では、トラフィックをパーソナライズするためにパーソナライゼーションモデルを構築したので、今後の訪問者に対しては、明確なトレードオフが存在することになります。 現在のモデルに基づいてすべてのトラフィックをパーソナライズする必要があるか、ランダムにオファーを提供して新しい訪問者から引き続き学習する必要があるか。 パーソナライゼーションアルゴリズムによって訪問者に関する新たなトレンドを見つけ出すための学習を常におこないながら、トラフィックの大部分をパーソナライズできれば効果的です。
マルチアームバンディットは、Target がこの目標を達成するのにどのように役立つかです。 マルチアームバンディットでは、モデルは常にトラフィックのごく一部を「消費」して、アクティビティ学習の全期間を通じて学習を継続し、それまでに学習したトレンドの乱用を防止します。
データサイエンスの世界ではマルチアームバンディット問題は探検と搾取のジレンマの典型的な例ですそれぞれの未知の報酬確率を持つワンアームバンディットのコレクションが与えられます 重要なのは、プレーの成功率が最も高く、受け取られる報酬の合計が最大となるアームを生む戦略を開発することです。オンラインモデルが構築された後のオンラインスコアリングのシステムでは、マルチアームバンディットが使用されます。 このプロセスは、探索中のオンライン学習に役立ちます。 現在のマルチアームアルゴリズムは epsilon (ε)貪欲なアルゴリズムです。 このアルゴリズムでは、確率 1- ε の場合に、最適なアームが選択され、確率 ε の場合は、その他のアームがランダムに選択されます。