「判別分析」プラットフォームを起動するには、[分析]>[多変量]>[判別分析]を選択します。
図5.3 「Iris.jmp」の「判別分析」起動ウィンドウ
「列の選択」の赤い三角ボタンのメニューのオプションについては、『JMPの使用法』の列フィルタメニューを参照してください。
メモ: [検証]ボタンは、JMP Proのみに表示されます。標準版JMPでは、除外した行を使用して、検証セットを定義できます。標準版JMPとJMP Proの違いを参照してください。
Y, 共変量
データ行をカテゴリのいずれかに分類するために使用する連続変数の列。
X, カテゴリ
各データ行が属するカテゴリ(グループ)を含む列。
重み
この役割を割り当てた列の数値は、分析において各行の重みとして使用されます。
度数
この役割を割り当てた列の数値は、分析において各行の度数として使用されます。度数列は、データテーブルの行を増やすような効果があります。つまり、ある行に度数として整数kを指定すると、その行はk個の行として扱われます。小数を含む度数も指定できます。
検証
検証セットを定義する数値列。この列には最大3つの異なる値が含まれていなければなりません。
– 検証列の値が2つしかない場合は、小さい方の値が学習セット、大きい方の値が検証セットとして扱われます。
– 値が3つある場合は、値の小さい方から順に、学習セット・検証セット・テストセットとして扱われます。
– 値が4つ以上ある場合は、最も小さい3つの値を含む行が検証セットになります。その他の行はすべて分析から除外されます。
「判別分析」プラットフォームでは、検証列を使ってモデルの学習および評価を行います。また、起動ウィンドウで[ステップワイズ変数選択]オプションを選択した場合も、検証列が指定されていると、ステップワイズ変数において検証セットから計算された統計量も表示され、モデルの学習・検証、または、モデルの学習・検証・評価が行われます。検証の詳細については、『予測モデルおよび発展的なモデル』のJMPのモデル化での検証を参照してください。
ヒント: [ステップワイズ変数選択]を使用しない場合、検証列には2つの異なる値のみが必要です。
「列の選択」リストで列を選択せず、[検証]ボタンをクリックすると、データテーブルに検証列を新規作成することができます。検証列を作成する方法の詳細については、『予測モデルおよび発展的なモデル』の検証列の作成を参照してください。
By
By変数の水準ごとに、個別に分析が行われます。
ステップワイズ変数選択
(「判別法」で[線形 横長データ]を選択した場合は使用できません。)共分散分析とp値を使って、ステップワイズ変数選択を実行します。ステップワイズ変数選択を参照してください。
検証セットを指定した場合、検証セットから計算された統計量も表示されます。この統計量は、[実行]ボタンを押したときに、ステップ数を判断するために使用されます。
判別分析の手法
判別分析に関する4つの手法があります。判別分析の手法を参照してください。
共分散行列の縮小
プールして計算された群内共分散行列の非対角要素(線形判別分析の場合)、もしくは、群ごとの群内共分散行列の非対角要素(2次判別分析の場合)を縮小します。これにより、ばらつきが小さくなり、予測の分散が減少する場合があります。共分散行列の縮小を参照してください。
詳細オプション
次のオプションがあります。
正準スコアを中心化しない
旧バージョンのJMPとの互換性のため、正準スコアを中心化しません。
疑似逆行列の使用
このオプションをオンにすると、共分散行列が特異である場合に、Moore-Penroseの疑似逆行列を使用します。このオプションをオンにしてMoore-Penroseの疑似逆行列を用いた場合、常に、スコアの計算式にすべての共変量が含まれます。このオプションをオフにすると、共分散行列が特異な場合、一次従属関係にある変数のうち、[Y, 共変量]リストで後に指定された変数がスコアの計算式に含まれません。
除外行でモデルを検証
データテーブルにて除外している行を、誤分類数などを計算するための検証セットとして扱います。