外れ値の箱ひげ図では、分布を観察したり、外れ値を見つけたりすることができます。一般に、箱ひげ図には、いくつかの分位点が表されています。
図3.8 外れ値の箱ひげ図
外れ値の箱ひげ図には、次のような情報が描かれます。
• 箱の中の横線は標本の中央値(メディアン)を示します。
• ひし形は、平均と、平均の95%信頼区間を表します。ひし形の中央にある水平線が平均を示し、ひし形の上下の点が、それぞれ平均の上側と下側の95%信頼限界を表します。
• 箱の両端は25%と75%の分位点で、それぞれ第1および第3四分位点とも呼ばれます。
• 第1四分位点と第3四分位点の差が、四分位範囲です。
• 箱の両端にはひげと呼ばれる線が付いています。ひげは、箱の端から、次の式で計算された範囲内で最も遠くにある点まで伸びています。
第1四分位点 - 1.5 ×(四分位範囲)
第3四分位点 + 1.5 ×(四分位範囲)
上の式で計算された範囲内にあるデータ点の一番大きい値と小さい値(つまり、外れ値を除いたもののなかでの最大値と最小値)が、ひげの両端になります。
• 箱の外側に表示されている括弧は、最短の半分(shortest half)を示します。これは、データの50%が密集する最も短い範囲です(Rousseeuw and Leroy 1987)。
• 外れ値の箱ひげ図からひし形や最短半分を削除する方法については、箱ひげ図からのひし形や最短半分の削除を参照してください。