多変量分析 > 判別分析 > 判別分析のオプション

公開日: 09/19/2023

判別分析のオプション

「判別分析」レポートの赤い三角ボタンをクリックすると、以下のオプションが表示されます。

ステップワイズ変数選択

（［線形横長データ］の判別法では使用できません。）「列選択」コントロールパネルの表示／非表示を切り替えます。このコントロールパネルには、共分散分析とp値を使ってステップワイズ変数選択を行うためのオプションが表示されます。ステップワイズ変数選択を参照してください。

判別分析の手法

判別法を指定します。［線形］・［2次］・［正則化］・［横長データ］のいずれかを選択できます。判別分析の手法を参照してください。

判別スコア

各データ行に対する判別スコアを示した表の表示／非表示を切り替えます。

スコアオプション

各データ行に対するスコアの計算に関するオプションがあります。

興味のある行だけを表示

「判別スコア」レポートに、誤判別されたデータ行と、予測確率が0.05～0.95のデータ行だけを表示します。

度数の表示

「スコアの要約」レポートにおいて、混同行列および混同率行列の表示／非表示を切り替えます。混同行列は、応答変数の実測値と予測値を2元度数表にまとめたものです。混同率行列は、混同行列と似た行列ですが、度数ではなく、度数を行合計で割った割合をまとめたものです。混同行列では、カテゴリカル変数Xの各水準において、実測値と予測値の度数が示されています。デフォルトの「スコアの要約」レポートには、混同行列と混同率行列が表示されます。JMP Proで検証セットやテストセットを使用した場合、それらのセットに対しても混同行列と混同率行列が表示されます。また、標準版JMPで除外したデータ行で検証する場合には、その除外したデータ行が検証セットとみなされ、検証セットに対する混同行列と混同率行列も表示されます。標準版JMPとJMP Proの違いを参照してください。

各グループ平均への距離を表示

各観測値から各グループ平均までのMahalanobisの距離を2乗したものを示すレポートの表示／非表示を切り替えます。

各グループに属する確率を表示

各グループに属する確率を示すレポートの表示／非表示を切り替えます。この確率は、カテゴリカル変数Xの各グループに各データ行が属する確率です。

ROC曲線

「スコアの要約」レポート上のROC曲線の表示／非表示を切り替えます。ROC曲線の詳細については、『予測モデルおよび発展的なモデル』のROC曲線を参照してください。

誤判別された行を選択

誤判別されたデータ行を、データテーブル内と、「判別スコア」レポート内で選択します。

不確実な行を選択

判別が不確実なデータ行を、データテーブル内と、「判別スコア」レポート内で選択します。「判別が不確実な行」とは、いずれのグループに属する確率も0や1に近くないデータ行です。

このオプションを選択すると、ウィンドウが表示され、そこで不確実さを示す予測確率の範囲を指定できます。デフォルトでは、予測確率が0または1から0.1以上離れているデータ行が、「不確実な行」とされます。したがって、デフォルトでは、0.1～0.9の確率となっているデータ行が選択されます。

計算式の保存

距離、確率、および、どのグループに判別されるかの予測値を求める計算式を、データテーブルに保存します。保存される計算式に関する統計的詳細を参照してください。

– SqDist0およびSqDist[<水準>]は、距離の計算式です。ここで、「<水準>」はXの水準です。距離の計算式は、Mahalanobisの距離に関連した計算式です。

– Prob[<水準>]は、確率の計算式です。ここで、「<水準>」はXの水準です。この確率は、Xの各水準に該当のデータ行が属する事後確率です。確率の各列には「応答確率」列プロパティが保存されます。「応答確率」列プロパティについては、『JMPの使用法』を参照してください。

– Pred <X>は、予測値の計算式です。「最も属する確率が高い水準」を求めるための計算式になっています。

– ［線形横長データ］の判別法では、共変量のベクトルと、判別のための主成分の計算式を含む「判別データ行列」列も保存します。横長データに対する線形判別法を参照してください。

メモ: ［線形横長データ］以外のすべての判別法では、計算式を保存すると、RowEdit Probスクリプトがデータテーブルに保存されます。このスクリプトはデータテーブル内の不確実な行を選択します。不確実な行と定義されるのは、予測確率が0または1から0.1以上離れている行です。このスクリプトが開く「行の編集」ウィンドウでは、不確実な行を調べることができます。（［線形横長データ］以外の手法で）新しい判別分析を実行し、［計算式の保存］を選択した場合、既存のRowEdit Probスクリプトは、新しい判別分析の結果によって上書きされます。

計算スクリプトの作成

（標準版JMPでのみ使えます。）計算式列を作成するスクリプトを作成します。これらの計算式列は、［計算式の保存］オプションによって保存されるものです。このスクリプトを保存しておけば、他のデータテーブルにおいて、各グループに属する確率を計算する計算式列や、どのグループに属するかを予測する計算式列を作成できます。

ここに画像を表示確率の計算式を発行

（JMP Proでのみ使えます。）確率の計算式を作成し、それを「計算式デポ」レポート内の計算式列スクリプトとして保存します。「計算式デポ」レポートが開いていない場合は、このオプションによって「計算式デポ」レポートが作成されます。『予測モデルおよび発展的なモデル』の計算式デポを参照してください。

正準プロット

「正準プロット」の表示／非表示を切り替えます。正準プロットと正準構造を参照してください。

正準オプション

正準プロットと三次元正準プロットに関するオプションが含まれます。

点の表示

正準プロットおよび三次元正準プロットにおいて、点の表示／非表示を切り替えます。

平均の信頼限界楕円の表示

正準プロットおよび三次元正準プロットにおいて、各グループの平均に対する95%信頼楕円の表示／非表示を切り替えます。この信頼楕円は、正規分布に従うと仮定して求められています。

正規50%等高線の表示

正準プロットおよび三次元正準プロットにおいて、各グループにおける50%等高線を示す楕円の表示／非表示を切り替えます。正準プロットにおける各楕円は、最初の2次元の正準スコアが２変量多変量正規分布に従っている場合にデータの50%を含むと推定される領域です。同様に、三次元正準プロットにおける各楕円体は、最初の3次元の正準スコアが3変量多変量正規分布に従っている場合にデータの50%を含むと推定される領域です。

バイプロット線の表示

正準プロットおよび三次元正準プロットにおけるバイプロット線の表示／非表示を切り替えます。バイプロット線は、正準空間における共変量の方向を示します。また、バイプロット線は、共変量の各正準変数に対する関連の度合いを示します。

バイプロット線の位置

正準プロットおよび三次元正準プロットにおけるバイプロット線の位置と半径のスケールを指定します。

– デフォルトでは、バイプロット線は全体平均を示す点(0,0)を出発点とした直線で表されています。正準プロットでバイプロット線をドラッグして移動するか、またはこのオプションによって出発点の座標を指定できます。

– 正準プロットに表示されるデフォルトの半径のスケールは、バイプロット線を表示するために調整の必要が生じない限り、1.5です。半径のスケールは、標準化スコア係数に対するものです。

プロット点の色分け

正準プロットおよび三次元正準プロットにおいて、X変数の水準ごとに色を付けます。また、このとき、データテーブルの行に対しても、色のマーカーが設定されます。これは、［行］>［列の値による色/マーカー分け］でX変数の列を選択するのと同じです。また、グラフを右クリックして［行の凡例］を選択し、X変数の水準ごとに色を設定するのとも同じです。

正準の詳細を表示

「正準の詳細」レポートの表示／非表示を切り替えます。正準の詳細を表示を参照してください。

正準構造の表示

「正準構造の表示」レポートの表示／非表示を切り替えます。正準構造の表示を参照してください。ただし、このオプションも、［線形横長データ］の判別法では使用できません。

正準スコアの保存

データテーブルに新しい列を作成し、各データ行の正準スコア計算式を保存します。k番目の正準スコアの列は、Canon[<k>]という名前になります。

ヒント: スクリプトの場合は、DiscriminantオブジェクトにSave to New Data Tableコマンドを送ると、正準変数のグループ平均、標準化スコア係数の半径スケール1.5のバイプロット線、および正準スコアが新しいデータテーブルに保存されます。ただし、このオプションも、［線形横長データ］の判別法では使用できません。

三次元正準プロット

三次元正準プロットを表示します。このオプションは、カテゴリカル変数Xの水準が4つ以上ある場合のみ使用できます。三次元正準プロットの例を参照してください。

事前確率の指定

X変数の各水準の事前確率を指定できます。事前確率を指定するのに、次のようなオプションが用意されています。

等しい確率

すべてのグループに等しい事前確率を割り当てます。このオプションはデフォルトです。

発生頻度に比例

観測されたデータ内の発生頻度に比例する事前確率をグループに割り当てます。

その他

任意の事前確率を指定できます。

グループの追加

一部の点が、データにある既知のグループではなく、新しいグループに属する可能性があるときに使用します。グループの追加を参照してください。

グループ内共分散行列の表示

次のレポートの表示／非表示を切り替えます。

– プールした群内共分散行列と相関行列を表示する「共分散行列」レポート

– ［2次］と［正則化］の判別法では、群内相関行列を表示する「各グループの相関」レポートが表示されます。

各グループに対して、群内共分散行列の行列式の対数も表示されます。

– ［2次］の判別法では、「共分散行列」レポートにおける「グループ共分散」アウトラインに、群内共分散行列も表示されます。

［グループ内共分散行列の表示］は、［横長データ］の判別法では使用できません。

グループ平均の表示

各共変量の平均を表示する「グループ平均の表示」レポートの表示／非表示を切り替えます。X変数の各水準の平均と全体平均が表示されます。

判別行列の保存

「判別分析の結果」という名前のスクリプトをデータテーブルに保存します。このスクリプトは、JSLで使用できる次のような要素を含んだリストを作成するものです。

– 共変量（Y）の列名を含んだリスト

– カテゴリカル変数Xの列名を含んだ変数

– Xの水準名を含んだリスト

– （Xの各水準における）共変量の平均を含んだ行列

– プールした共分散行列

［判別行列の保存］は、［横長データ］の判別法では使用できません。判別行列の保存を参照してください。

散布図行列

（［線形横長データ］の判別法では使用できません。）共変量の各ペアに対する下三角の散布図行列を含むウィンドウが別に表示されます。検証セットが使用されている場合でも、散布図にはすべてのデータがプロットされます。カテゴリカル変数Xの各グループに対して、90%の領域を表す楕円が描かれます。線形判別分析の場合、楕円は、プールした群内共分散行列から計算されています。

「散布図行列」の赤い三角ボタンのオプションについては、『グラフ機能』を参照してください。

プロファイル

対話式のプロファイルの表示／非表示を切り替えます。このプロファイルは、カテゴリの確率を1行のプロファイルにまとめたものです。因子の値を変更すると、それに応じた応答の予測値の曲線が描かれます。赤い三角ボタンのメニューのオプションについては、『プロファイル機能』の「予測プロファイル」のオプションを参照してください。

以下のオプションの詳細については、『JMPの使用法』の「JMPレポートのローカルデータフィルタ」、「JMPレポートの［やり直し］メニュー」、および「JMPレポートの［スクリプトの保存］メニュー」を参照してください。

ローカルデータフィルタ

データをフィルタリングするためのローカルデータフィルタの表示／非表示を切り替えます。

やり直し

分析を繰り返したり、やり直したりするオプションを含みます。また、［自動再計算］オプションに対応しているプラットフォームにおいては、［自動再計算］オプションを選択すると、データテーブルに加えた変更が、該当するレポートに即座に反映されるようになります。

プラットフォーム環境設定

現在のプラットフォームの環境設定を表示したり、現在のJMPレポートの設定に合わせて環境設定を変更したりできます。

スクリプトの保存

レポートを再現するためのスクリプトを保存するオプションが、保存先ごとに用意されています。

Byグループのスクリプトを保存

By変数の全水準に対するレポートを再現するスクリプトを保存するオプションが、保存先ごとに用意されています。起動ウィンドウでBy変数を指定した場合のみ使用可能です。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).