Calcul du score de propension

Les calculs statistiques pour le score de propension sont définis.

Conceptuellement, le score calculé pour chaque visiteur est une probabilité estimée que le événement spécifié (défini par le filtre de cible) se produise, ce qui donne une plage de valeurs de score comprise entre 0 et 100 %. La procédure de notation utilise des échantillons existants comme données de formation pour trouver la relation entre la probabilité du événement et les variables indépendantes sélectionnées présentant un intérêt.

Mathématiquement, ces relations se reflètent dans chaque valeur quantitative associée à chaque variable indépendante. Ces valeurs sont appelées coefficients de modèle. ScoreDim utilise actuellement l’algorithme IRLS (Iterativement Repondéré Minimum Squares) pour estimer les coefficients du modèle. IRLS passe en revue les échantillons à plusieurs reprises jusqu'à ce que la différence de coefficients entre la passe actuelle et la passe précédente soit inférieure à 1.0e-6, à ce moment-là elle est appelée convergé. Cependant, selon les données, l'IRLS peut ne pas être en mesure d'atteindre la convergence.

Dans ce cas, l'itération de formation du modèle se terminera lorsque

  • la différence de coefficient devient plus importante au lieu de plus petite,
  • 1 000 laissez-passer ont été atteints, ou
  • une erreur mathématique empêche la poursuite de l'itération.

Si IRLS ne converge pas, un algorithme de sauvegarde appelé Stochastic Gradient Decent (SGD) sera utilisé. La SGD va également passer en revue les exemples de formation à plusieurs reprises. Mais contrairement à IRLS, les coefficients du modèle SGD sont contrôlés de sorte que la différence entre itération diminuera toujours de façon exponentielle. De même, la SGD prendra fin lorsque la différence de coefficient sera inférieure à 1,0e-6 ou 100 000 passes ont été atteintes. L'échec de l'IRLS et l'engagement de la SGD seront enregistrés dans le journal de suivi.

Pour les deux algorithmes, tous les exemples ne sont pas inclus dans la formation de modèles. 80 % sont actuellement utilisés pour former le modèle. Une fois le modèle formé, les 20 p. 100 restants seront utilisés pour évaluer la force du modèle en termes de précision, de rappel et de précision qui est calculée à partir de la matrice de confusion. Plus on se rapproche de 100 %, plus le modèle de score est efficace.

Sur cette page

Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Summit Banner

A virtual event April 27-28.

Expand your skills and get inspired.

Register for free
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now
Adobe Maker Awards Banner

Time to shine!

Apply now for the 2021 Adobe Experience Maker Awards.

Apply now