Fisherのあやめのデータでは、3つの異なる品種のあやめについて、4つの特性が測定されています。4種類の測定値から精確に品種を予測するのが目標です。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Iris.jmp」を開きます。
2. [分析]>[多変量]>[判別分析]を選択します。
3. 「がくの長さ」、「がくの幅」、「花弁の長さ」、および「花弁の幅」を[Y, 共変量]に指定します。
4. 「種類」を選択し、[X, カテゴリ]をクリックします。
5. [OK]をクリックします。
図5.2 「判別分析」レポートウィンドウ
「種類」は3群なので、正準変数は全部で2つしかありません。「正準プロット」は、最初の2次元の正準座標に各データ行をプロットしたものです。プロットを見ると、2次元の座標によって3つの品種が判別されていることがわかります。今回の例では検証セットがなかったため、「スコアの要約」レポートには学習セットのみの誤分類表が表示されています。検証セットがない場合、データセット全体が学習セットとみなされます。150行のデータ行のうち、3行だけが誤分類されています。