判別分析は、複数の連続変数から、どのグループ(カテゴリ)に属するかを予測します。判別分析は、連続尺度の応答変数(Y変数)から、カテゴリカルな分類変数(X変数)を予測します。判別分析では、所属するグループが既知で、そのグループを予測するために連続変数のデータを用います。
たとえば、ローンの申込者を、「リスク低」・「リスク中」・「リスク高」の3つのカテゴリ(X)に分類することを考えて見ましょう。収入・勤続年数・年齢・債務といった連続変数(Y)を使って、それらのカテゴリを予測するとします。この場合、連続変数によって各個人を各カテゴリに分類するための判別分析モデルを作成できます。
「判別分析」プラットフォームの特徴は次のとおりです。
• 判別に適した変数を選択するためのステップワイズ変数選択も行える
• 判別分析の手法として、線形判別分析・2次判別分析・正則化判別分析、そして、横長データに対する判別分析から選ぶことができる
• 正準プロットと誤分類の要約
• 各点がどのグループに近いかを示す判別スコア
• データテーブルに予測距離と予測確率を保存するオプション
図5.1 正準プロット