判別分析は、連続変数によって各オブザベーションをグループに分類します。言い換えると、カテゴリカルなX変数で示される所属先を、連続変数によって予測します。予測に使われる連続変数は、JMPの判別分析では、「共変量」と呼ばれており、「Y」と記されています。
判別分析はロジスティック回帰とは異なります。ロジスティック回帰では、連続変数を所与として、カテゴリカルな変数を確率変数として扱います。一方、判別分析では、カテゴリカルな変数を所与として、連続変数の共変量(Y)を確率変数として扱います。ただし、カテゴリカルな変数を連続変数で予測するという点では、これらの手法は似ています。
「判別分析」プラットフォームには、4つの手法が用意されています。どの手法も、各オブザベーションから各グループの多変量平均(重心ともいう)までの距離を、Mahalanobisの距離で求めます。また、グループへ属する事前確率も指定することができます。それらの事前確率は距離の計算で考慮されます。各オブザベーションは、最も距離が近いグループに判別されます。
•
|
線形 — この手法では、群内共分散行列(グループ内共分散行列)がすべて等しいと仮定されます。そして、共変量Yの平均ベクトルだけが各群で異なると仮定されます。
|