多変量分析 > 判別分析 > 「判別分析」プラットフォームの概要
公開日: 04/01/2021

「判別分析」プラットフォームの概要

判別分析は、連続変数によってデータ行(観測、オブザベーション)のそれぞれをグループに分類します。言い換えると、カテゴリカルなX変数で示される所属先を、連続変数によって予測します。予測に使われる連続変数は、JMPの判別分析では、「共変量」と呼ばれており、「Y」と記されています。

判別分析はロジスティック回帰とは異なります。ロジスティック回帰では、連続変数を所与として、カテゴリカルな変数を確率変数として扱います。一方、判別分析では、カテゴリカルな変数を所与として、連続変数の共変量(Y)を確率変数として扱います。ただし、カテゴリカルな変数を連続変数で予測するという点では、これらの手法は似ています。

「判別分析」プラットフォームには、4つの手法が用意されています。どの手法も、各データ行から各グループの多変量平均(重心ともいう)までの距離を、Mahalanobisの距離で求めます。また、グループへ属する事前確率も指定することができます。それらの事前確率は距離の計算で考慮されます。各データ行は、最も距離が近いグループに判別されます。

用意されている手法には次のものがあります。

線形 — この手法では、群内共分散行列(グループ内共分散行列)がすべて等しいと仮定されます。そして、共変量Yの平均ベクトルだけが各群で異なると仮定されます。

2次 — 群内共分散行列がすべて異なると仮定されます。この手法では、共分散行列を推定するのに、線形判別の場合よりも多くのパラメータを推定しなければいけません。ある群の標本サイズが小さい場合、推定値が不安定になってしまう危険があります。

正則化 — 群内共分散行列がすべて異なると仮定されますが、より安定した推定値を導き出すために2つの調整方法が用意されています。この手法は、群の標本サイズが小さいときに役立ちます。

横長データ — 共変量の数が多くて、他の手法では計算が難しい場合に役立ちます。この手法では、群内共分散行列がすべて等しいと仮定されます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).