Option d’arbre de régression pour l’arbre de décision

Dernière mise à jour : 2022-10-05
  • Créé pour :
  • User
    Admin
IMPORTANT

En savoir plus sur le Data Workbench Annonce de fin de vie.

Évaluez un arbre de décision à l’aide de l’option Arborescence de régression avec de nouvelles fonctionnalités d’échantillonnage et de visualisation.

Évaluez un arbre de décision à l’aide de l’option Arborescence de régression en cliquant avec le bouton droit de la souris et en sélectionnant Options > Arborescence de régression dans une visualisation Arborescence de décision.

Créateur d’arbre de décision mis à jour: Le nouvel algorithme a été introduit pour la création d’un Arborescence de décision. Il gère des données plus générales et fournit une visualisation plus informative pour améliorer la précision de la prédiction.

Amélioration du module d’échantillonnage de données: Un modèle d’échantillonnage adaptatif mis à jour permet à l’arbre de décision et au score de propension d’obtenir des résultats plus précis.

Le vert et le rouge indiquent vrai ou faux. La saturation des couleurs (rouge profond ou rouge clair, par exemple) est utilisée pour indiquer la probabilité. Par exemple, un noeud dont la probabilité est très élevée a une probabilité très élevée d’être faux, tandis qu’un noeud dont la probabilité est faible est fausse. Un noeud avec un vert profond a une très forte probabilité d’être vrai.

Tous les arbres de décision ont des largeurs de branche variables pour indiquer le niveau de trafic de cette branche de l’arborescence.

Dans une visualisation Arborescence de décision, cliquez avec le bouton droit de la souris et sélectionnez Options > Arborescence de régression. Lorsque cette option est sélectionnée, des paramètres supplémentaires sont fournis :

Paramètre de régression Description

Utiliser chaque fonction une seule fois

La sélection de cette option n’utilise pas une fonction plusieurs fois (comme l’arbre de décision d’origine). Par conséquent, si vous disposez de cinq entrées, l’arborescence ne sera pas supérieure à cinq niveaux et la structure de l’arborescence ressemblera à un arbre de décision (mais un peu plus complexe). Cette option rend la création de l’arborescence rapide en n’utilisant chaque fonction qu’une seule fois (comme un arbre de décision d’origine). L’utilisation de cette fonctionnalité est un paramètre par défaut.

Paramètre de niveau d’arborescence de régression

Cette option contrôle la complexité de l’arbre de régression. Selon vos données, vous devrez peut-être créer une Fine arborescence (avec une structure complexe avec plus de noeuds) pour obtenir une classification d’arborescence plus significative. Si vous disposez de nombreuses données, une variable Gros arborescence (moins compliquée avec moins de noeuds d’arborescence) peut fonctionner correctement.

Remarque : Typique est le paramètre par défaut. Dans certains cas extrêmes, la variable Typique ne fonctionne pas également et la variable Gros ou Fine peut fournir une meilleure vue des données.

Fine: Arborescence la plus complexe avec les niveaux de rapports les plus granulaires et la plupart des branches.

Typique: Niveau moyen de granularité et de branches.

Gros: Arborescence la moins complexe avec le moins de catégories définies et le moins de branches.

Sur cette page