「判別スコア」レポートでは、各データ行の判別結果と、それを求めるために用いた情報がわかります。
行
データテーブルにおける、そのデータ行の行番号
実測値
そのデータ行がもつ、分類変数の実測値
平方距離(実測値)
分類変数の実測値に対するSqDist[<水準>]の値。スコアオプションを参照してください。
注: 式にオフセット項があるため、SqDist(Actual) は負の値になることがあります。
確率(実測値)
分類変数の実測値に所属する確率(の推定値)。
-Log(確率)
「確率(実測値)」の対数の符号を逆にしたもの。この値が大きいものは、「実際に観測されたカテゴリに判別されにくい」という意味でうまく予測されていません。
「-Log(確率)」の数値の横には、その棒グラフが描かれています。棒グラフの棒が長いものは、点の予測がよくないことを表します。また、誤判別されたデータ行にはアスタリスク(*)がついています。
検証セットまたはテストセットを使用した場合、検証セット内のデータ行には「v」、テストセット内のデータ行には「t」の印がつきます。
予測値
分類変数に対する予測値。この予測値は、推定された所属確率が最も大きいカテゴリです。
確率(予測値)
予測されたカテゴリに所属する確率(の推定値)。
その他
予測確率が0.1を超えるその他のカテゴリがあれば、それらのカテゴリをリストします。
図5.11は、「Iris.jmp」サンプルデータの線形判別法による「判別スコア」レポートです。[スコアオプション]>[興味のある行だけを表示]を選択して、誤判別の行、および、予測確率が0.05~0.95の範囲内の行だけを表示しています。
図5.11 興味のある行だけを表示