会社の業種によって利益の平均に差があるかどうかを調べたいとしましょう。「Companies.jmp」には、2つの異なる業種の会社のデータが含まれています(製薬業界12社とコンピュータ業界20社)。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Companies.jmp」を開きます。
2. [分析]>[二変量の関係]を選択します。
3. 「利益($M)」を選択し、[Y, 目的変数]をクリックします。
4. 「タイプ」を選択し、[X, 説明変数]をクリックします。
5. [OK]をクリックします。
6. 「タイプによる利益($M)の一元配置分析」の赤い三角ボタンをクリックし、[表示オプション]>[箱ひげ図]を選択します。
「Computer」の利益の分布
箱ひげ図によると、データは正規分布に従わず、対称でもないようです。また、32行目に非常に大きな値があり、通常のt検定ではこの1つのデータ値が検定結果に大きく影響する恐れがあります。
7. 「タイプによる利益($M)の一元配置分析」の赤い三角ボタンをクリックし、[平均/ANOVA/プーリングしたt検定]を選択します。
会社の分散分析
F検定では、p値が大きく(p = 0.1163)、有意ではないことが示されています。この結果は、大きな値をもつ32行目のデータや、正規性の仮定が満たされていないことに起因している可能性があります。
8. 「タイプによる利益($M)の一元配置分析」の赤い三角ボタンをクリックし、[個々の分散を用いたt検定]を選択します。
t検定の結果
両側検定のProb > |t|は、0.0671です。分散が異なるt検定は等分散性を仮定していませんが、外れ値の影響を受けやすい検定です。
9. 「タイプによる利益($M)の一元配置分析」の赤い三角ボタンをクリックし、[ノンパラメトリック]>[Wilcoxon検定]を選択します。
Wilcoxon検定の結果
Wilcoxon検定は、順位に基づく検定です。順位に基づいているため、外れ値の影響を受けにくいという特徴があります。また、正規性も仮定していません。
正規近似とカイ2乗近似の両方で、p値が0.0010以下であり、有意となっています。これにより、これら2つの分布には有意な違いがあり、会社のタイプによって利益の分布は異なっていると結論付けることができます。
正規近似およびカイ2乗近似の検定は、いずれも検定統計量の漸近分布に基づいたものです。JMP Proでは、正確検定を行うことができます。
10. 「タイプによる利益($M)の一元配置分析」の赤い三角ボタンをクリックし、[ノンパラメトリック]>[正確検定]>[正確Wilcoxon検定]を選択します。
正確Wilcoxon検定の結果
検定の結果では、S = 283となっています。この値は、「タイプ」のうち標本サイズが小さいほうの水準(「Pharmaceutical」)のオブザベーションの順位の和です。Sとその期待値との差の絶対値が、観測された値(観測されたSとその期待値との差の絶対値)以上となる確率は、0.0005です。これは、Wilcoxon検定の両側検定に対する結果であり、「利益の分布がタイプによって異ならない」という帰無仮説を棄却する根拠となります。
この例では、ノンパラメトリックな検定のほうが分散分析や分散が異なるt検定よりも適切でしょう。Wilcoxon検定は、32行目の大きな値の影響を受けにくく、正規分布を前提としていないからです。