例としてFisherが取り上げたあやめのデータ(Mardia, Kent, and Bibby(1979))を用います。このデータには、3品種(k=3)の「種類」について4変数の測定値があります。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Iris.jmp」を開きます。
2. [分析]>[モデルのあてはめ]を選択します。
3. 「花弁の長さ」、「花弁の幅」、「がくの長さ」、および「がくの幅」を選択し、[Y]をクリックします。
4. 「種類」を選択し、[追加]をクリックします。
5. 「手法」として[MANOVA]を選択します。
6. [実行]をクリックします。
7. 「MANOVAのあてはめ」の赤い三角ボタンをクリックし、[判別結果の保存]を選択します。
以下の列が「Iris.jmp」サンプルデータに追加されます。
SqDist[0]
Mahalanobisの距離を計算するために必要な2次式。
SqDist[setosa]
「setosa」の重心から各観測までのMahalanobisの距離。
SqDist[versicolor]
「versicolor」の重心から各観測までのMahalanobisの距離。
SqDist[virginica]
「virginica」の重心から各観測までのMahalanobisの距離。
Prob[0]
Mahalanobisの距離を指数変換し、符号を逆にして合計したもので、以下の確率の計算に使用される。
Prob[setosa]
「setosa」カテゴリに含まれる確率。
Prob[versicolor]
「versicolor」カテゴリに含まれる確率。
Prob[virginica]
「virginica」カテゴリに含まれる確率。
Pred 種類
属している確率が最も高いと判断された「種類」。
データテーブルに新規作成されたこれらの列は、別のプラットフォームで、判別分析の結果を要約するのに使えます。たとえば、次のような手順で要約できます。
1. 更新された「Iris.jmp」サンプルデータ(新しい列が追加されたデータテーブル)から、[分析]>[二変量の関係]を選択します。
2. 「種類」を選択し、[Y, 応答]をクリックします。
3. 「Pred 種類」を選択し、[X, 説明変数]をクリックします。
4. [OK]をクリックします。
分割表に、判別結果が表示されます。誤分類されている行が3つあるのがわかります。
図9.13 予測値と実測値の分割表