公開日: 09/19/2023

分位点範囲の外れ値

「外れ値を調べる」プラットフォームの「分位点範囲の外れ値」手法ユーティリティでは、各列の分位点によって極端な値を識別します。分位点の計算には特定の確率分布を仮定する必要がないので、外れ値を検出するのに分位点を用いるのは便利です。分位点を求めるには、まず、データを小さい値から大きい値へと並べます。そして、たとえば、20%の分位点は、データの20%がそれより小さい値です。「分位点範囲の外れ値」ユーティリティでの外れ値は、分位点の範囲(2つの分位点の差)の定数倍によって定義されます。分位点の計算方法の詳細については、『基本的な統計分析』の分位点の統計的詳細を参照してください。

「分位点範囲の外れ値」手法は、データにある欠測値コードを識別するのにも便利です。一部の業界では、欠測値を「9」として入力しています(「999」や「9999」など)。この手法では、上側分位点以上のデータ値のなかで全部の数字が「9」になっている整数をすべて、欠測値コードの候補として取り上げます。その後、これらの欠測値コードをデータテーブルの列プロパティとして追加するか、またはデータテーブルでこれらの値を欠測値に変更できます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).