デシジョンツリーのオプション

重要

Data Workbench 提供終了のお知らせ.

デシジョンツリーメニューには、ポジティブユースケース、フィルター、リーフ配分オプション、混同行列などの高度なオプションを設定する機能が用意されています。

ツールバーのボタン 説明
移動 クリックすると、デシジョンツリーアルゴリズムが実行され、ビジュアライゼーションが表示されます。これは、入力があるまで、グレー表示です。
リセット 入力とデシジョンツリーモデルをクリアし、プロセスをリセットします。
保存 デシジョンツリーを保存します。デシジョンツリーは、様々な形式で保存できます。
  • 予測マークアップ言語(PMML):アプリケーションでデシジョンツリーモデルを記述および交換するために使用される XML ベースのファイル形式。
  • true または false、パーセンテージ、メンバーの数および入力値のシンプルな列と行を表示するテキスト
  • ディメンションと、予測結果のエレメントに対応する分岐。
オプション オプションメニューについては、以下の表を参照してください。
オプションメニュー 説明
ポジティブケースを設定 現在のワークスペースの選択をモデルのポジティブケースとして定義します。何も選択されていない場合は、ケースをクリアします。
母集団フィルターを設定 現在のワークスペースの選択をモデルの母集団フィルターとして定義し、この条件を満たす訪問者から取得します。デフォルトは「全員」です。
複雑なフィルターの説明を表示 定義されたフィルターの説明を表示します。クリックすると、ポジティブケースと母集団フィルターのフィルタースクリプトが表示されます。
ノードを非表示 母集団の割合が小さいノードを非表示にします。このメニューコマンドは、デシジョンツリーが表示されているときにのみ表示されます。
混同行列

オプション混同行列をクリックすると、正解率、再現率、精度、F-スコアの値が表示されます。100%に近いほど、よいスコアです。

混同行列は、次の値の組み合わせを使用して、モデルの正解率の 4 カウントを付与します。

  • 実際の陽性(AP)
  • 予測された陽性(PP)
  • 実際の陰性(AN)
  • 予測された陰性(PN)

ヒント:これらの数は、真の正解とわかっている 20%を差し引いた検定データに、結果のスコアリングモデルを適用することで取得されます。スコアが 50%を超える場合、(定義されたフィルターに一致する)ポジティブケースとして予測されます。このとき、正解率 = (TP + TN)/(TP + FP + TN + FN)、再現率 = TP / (TP + FN)、精度 = TP / (TP + FP) です。

凡例を表示 デシジョンツリーの凡例キーのオンとオフを切り替えることができます。このメニューコマンドは、デシジョンツリーが表示されているときにのみ表示されます。
アドバンス クリックすると、デシジョンツリーを細かく制御するための詳細メニューが開きます。メニューオプションについては、以下の表を参照してください。
詳細メニュー 説明
トレーニングセットサイズ

モデルの構築に使用するトレーニングセットのサイズを制御します。セットが大きいほどトレーニングの時間は長くなり、セットが小さいほど時間は短くなります。

入力の正規化

最小 - 最大と Z-スコア手法のどちらを使用してモデルへの入力を正規化するかをユーザーが指定できます。

SMOTE オーバーサンプリング係数 トレーニングサンプルでポジティブケースがあまり頻繁に発生しない(10%未満の)場合、SMOTE を使用して、追加のサンプルを提供します。このオプションを使用すると、ユーザーが SMOTE を使用して追加作成するサンプルの数を指定することができます。
リーフクラス配分しきい値 ツリー構築処理時にリーフとして想定されるしきい値を設定できます。デフォルトでは、ノードがリーフになるには、(プルーニングステージの前に)そのノードのすべてのメンバーが同一である必要があります。

このページ