公開日: 09/19/2023

外れ値分析

「多変量」の赤い三角ボタンのメニューには、[外れ値分析]メオプションがあり、外れ値の検出に役立つ距離のサブメニューが3つ含まれます。各オプションは、中心からの距離のプロットの表示/非表示を切り替えます。この距離の計算は、相関構造に基づきます。検定は、プロットの下部に表示される有意水準(α)で行われます。

Figure 3.5のA点は、いずれの座標においても外れていませんが、相関構造を考慮したときに外れているために、外れ値とみなされます。

図3.5 外れ値の例 

外れ値の例

距離のオプションには以下のものがあります。

Mahalanobisの距離

各点から平均ベクトル(重心)までのMahalanobisの距離。Mahalanobisの距離は、データの平均・標準偏差・相関係数行列に基づいて計算されます。行番号に対して距離がプロットされます。距離が大きくなっている点をクリックすると、どの行が外れ値になっているかがわかります。Mahalanobis距離の計算を参照してください。

ジャックナイフ法による距離

ジャックナイフ法で計算した距離。この距離は、該当する行を除いたときの平均・標準偏差・相関係数行列に基づいて計算されます。特にデータに1個だけ外れ値がある場合、ジャックナイフ法が役立ちます。外れ値が1つある場合、通常のMahalanobis距離ではその1つの外れ値に影響され、外れ値を識別しにくくなったり、通常の点が実際よりも離れた位置にあるように見えたりします。ジャックナイフ法による距離の計算を参照してください。

T2

Mahalanobis距離の2乗。このプロットは多変量管理図において広く使用されています。このプロットには、T2統計量がプロットされ、また上側管理限界が描かれます。管理限界よりも上にある値は、外れ値の可能性があります。T2距離の計算を参照してください。

図3.6 「外れ値分析」プロット 

「外れ値分析」プロット

距離の保存

プロットの赤い三角ボタンのメニューから[保存]オプションを選択すると、距離をデータテーブルに保存できます。

メモ: その際、計算式は保存されないため、データテーブルに変更を加えても距離の再計算は行われません。データテーブル内で、列の追加/削除や値の変更を行ったときは、[分析]>[多変量]>[多変量の相関]を選択して、もう一度計算をやり直してください。

各行の距離が保存されるほか、[外れ値分析]で指定された上側管理限界の値を保持する列プロパティも作成されます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).