並列箱ひげ図(並べて表示した箱ひげ図)には、次の情報が示されます。
• 1つのカテゴリカル変数と1つの連続変数の関係
• カテゴリカル変数の水準ごとの連続変数の違い
図4.18 並列箱ひげ図の例
この例では、鎮痛剤に関するサンプルデータ「Analgesics.jmp」を使用します。このテーブルには、3つの薬のいずれかを処方された患者の痛みの程度が記録されています。
研究者は、次の点を調査する必要があります。
• 薬によって鎮痛作用の平均に違いはあるか。
• 各薬の鎮痛作用のばらつきに違いはあるか。ばらつきが大きい薬は、ばらつきが小さい薬より信頼性が低くなります。
これらの回答を導き出すには、「薬」と「痛みの程度」との並列箱ひげ図を表示します。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Analgesics.jmp」を開きます。
2. [分析]>[二変量の関係]を選択します。
3. 「痛みの程度」を選択し、[Y, 目的変数]をクリックします。
4. 「薬」を選択し、[X, 説明変数]をクリックします。
図4.19 「二変量の関係」ウィンドウ
5. [OK]をクリックします。
6. 「薬による痛みの程度の一元配置分析」の赤い三角ボタンをクリックし、メニューから[表示オプション]>[箱ひげ図]を選択します。
図4.20 並列箱ひげ図
箱ひげ図は、次の原則に従っています。
• 箱のなかを横切る水平線は、中央値を表す。
• データの半分は箱内に収まる。
• 大半のデータは、ひげの端から端までの間に収まる。
• ひげの外側のデータ点は、外れ値の可能性がある。
図4.20の箱ひげ図から、次のことがわかります。
• A薬を処方された患者は、他の薬よりも痛みの程度が小さくなっている。A薬の箱ひげ図は、他の箱ひげ図と比べて痛みの程度が低くなっています。
• B薬は、A薬やC薬と比べてばらつきが大きい。B薬の箱ひげ図は、他よりも縦幅が長くなっています。
C薬には、他のデータと比べて著しく低い位置にある点が1つあります。この点にポインタを置くと、データテーブルの26行目に該当することがわかります。この点は、A薬やB薬のデータの方に似通っているように見受けられます。26行目のデータは調べたほうがよいでしょう。ひょっとすると、データの記録時に誤入力があったのかもしれません。