公開日: 09/19/2023

外れ値を調べる

一変量や多変量での外れ値を見つける

「外れ値を調べる」プラットフォームでは、外れ値を識別、探索、および管理できます。データの外れ値を調べることは、重要です。外れ値が生じる理由としては、データの収集や記録における入力ミス、測定システムの不備、欠測値コードやエラーコードを生のデータ値として扱ってしまっている、あるいは異常な値などが考えられます。外れ値により、推定値に歪みが生じ、結果にバイアスがかかってしまう可能性があります。

たとえば、外れ値があると、標本分散が過大に推定されてしまいます。しかし、場合によっては、外れ値を除去せずにそのまま残しておくべきかもしれません。なぜなら、外れ値を除去することにより、逆に、標本分散が過小に推定され、逆の方向にバイアスがかかるかもしれないからです。

外れ値を除去するかどうかにかかわらず、外れ値の存在を認識することは大切です。外れ値を視覚的に見つける方法はいくつかあります。たとえば、箱ひげ図、ヒストグラム、および散布図を描くことによって、極端な値を見つけられることがあります。『はじめてのJMP』の「データの視覚化」を参照してください。

図21.1 多変量のk近傍法外れ値の例 

多変量のk近傍法外れ値の例

目次

「外れ値を調べる」の概要

分位点範囲の外れ値
ロバスト推定による外れ値
ロバスト主成分分析による外れ値
K近傍法外れ値

「外れ値を調べる」の例

「外れ値を調べる」プラットフォームの起動

「外れ値を調べる」レポート

「分位点範囲の外れ値」レポート
「ロバスト推定による外れ値」レポート
「ロバスト主成分分析による外れ値」レポート
「K近傍法」レポート

「外れ値を調べる」プラットフォームのオプション

「外れ値を調べる」プラットフォームの別例

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).