公開日: 04/01/2021

多変量ロバスト推定による外れ値

「多変量ロバスト推定による外れ値」ユーティリティは、「多変量の相関」プラットフォームの[ロバスト]オプションを使用して、多変量間の関係を調べます。「多変量の相関」プラットフォームの仕組みの詳細については、『多変量分析』の多変量の相関を参照してください。

外れ値分析

「外れ値分析」レポートでは、各点から多変量正規分布の中心までのMahalanobisの距離が計算されています。Mahalanobisの距離が同じところを結ぶと、多変量正規分布における確率密度の等高線になります。Mahalanobisの距離から大きいほど、外れ値である確率が高くなります。Mahalanobisの距離などの詳細については、『多変量分析』の「多変量の相関」プラットフォームのオプションを参照してください。

行を除外した後、分析を再実行するか、またはユーティリティを閉じてください。分析を再実行すると、除外されていない行だけで多変量分布の中心が再計算されます。なお、除外された行をデータテーブルにて非表示にしない限り、それらの行はグラフに表示されたままです。

「Mahalanobisの距離」の赤い三角ボタンのメニューから、[Mahalanobisの距離を保存]を選択すると、Mahalanobisの距離をデータテーブルに保存できます。

図20.8 「多変量ロバスト推定による外れ値」の「Mahalanobisの距離」プロット 

Multivariate Robust Outliers Mahalanobis Distance Plot

図20.8は、16列から計算されたMahalanobisの距離です。プロットには、4.82の位置に上側管理限界(UCL; upper control limit)も描かれています。このUCLは、どの程度のデータを外れ値として扱うかを考えるのに役立ちます。ただし、どれを外れ値とするかは、各状況に応じて判断してください。UCL(上側管理限界)の詳細については、Mason and Young(2002)を参照してください。

[多変量のロバスト推定による外れ値分析]のオプション

[多変量のロバスト推定による外れ値分析]の赤い三角ボタンのメニューには、多変量データを分析するための数々のオプションがあります。これらのオプションとそれらの説明については、『多変量分析』の「多変量の相関」プラットフォームのオプションを参照してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).