この例では、40人の生徒の年齢と身長に関するデータを使用します。変数の分布をグラフにして、分布の外れ値を特定しましょう。
1. [ヘルプ]>[サンプルデータフォルダ]を選択し、「Big Class.jmp」を開きます。
2. [分析]>[一変量の分布]を選択します。
3. 「年齢」と「身長(インチ)」を選択し、[Y, 列]をクリックします。
4. [OK]をクリックします。
図3.2 「一変量の分布」プラットフォームの例
ヒストグラムを見ると、次のことがわかります。
• 年齢の分布は一様ではありません。
• 「身長(インチ)」のヒストグラムには、離れている点が2つあります(外れ値である可能性があります)。
「身長(インチ)」のヒストグラムで「50」の棒をクリックし、外れ値の可能性が高い点について検討します。
• 「年齢」のヒストグラムで、対応する年齢が強調表示されます。外れ値の年齢は12であることがわかります。
• データテーブル内では、選択した棒に対応する行が強調表示されます。外れ値の名前はLillieとRobertであることがわかります。
「身長(インチ)」のヒストグラムの外れ値にラベルを追加します。
1. 両方の外れ値を選択します。
2. いずれかの外れ値を右クリックして[行ラベル]を選択します。
データテーブルでは、該当行にラベルアイコンが追加されます。
3. 必要に応じて、ラベル全体が表示されるように箱ひげ図の幅を広げてください。
図3.3 ラベルを付けた外れ値