「一元配置」プラットフォームでWilcoxon検定を使い、会社の業種によって利益の平均に差があるかどうかを調べてみましょう。2つの異なる業種の会社(製薬業界12社とコンピュータ業界20社)のデータを使用します。
1. [ヘルプ]>[サンプルデータフォルダ]を選択し、「Companies.jmp」を開きます。
2. [分析]>[二変量の関係]を選択します。
3. 「利益($M)」を選択し、[Y, 目的変数]をクリックします。
4. 「タイプ」を選択し、[X, 説明変数]をクリックします。
5. [OK]をクリックします。
6. 「一元配置分析」の赤い三角ボタンをクリックし、[表示オプション]>[箱ひげ図]を選択します。
図6.22 「Computer」の利益の分布
箱ひげ図を見ると、グループ内の利益は正規分布に従わず、対称でもないようです。また、32行目に非常に大きな値があり、通常のt検定ではこの1つのデータ値が検定結果に大きく影響する恐れがあります。
7. 「一元配置分析」の赤い三角ボタンをクリックし、[ノンパラメトリック]>[Wilcoxon / Kruskal-Wallis検定]を選択します。
図6.23 Wilcoxon検定の結果
0.5の連続修正を行う正規近似とカイ2乗近似の両方で、p値が0.0010以下であり、有意となっています。これにより、これら2つの分布には有意な違いがあり、会社のタイプによって利益の分布は異なっていると結論付けることができます。
正規近似およびカイ2乗近似の検定は、いずれも検定統計量の漸近分布に基づいたものです。正確検定を行うこともできます。
8. 「一元配置分析」の赤い三角ボタンをクリックし、[ノンパラメトリック]>[正確検定]>[正確Wilcoxon検定]を選択します。
図6.24 正確Wilcoxon検定の結果
検定の結果では、S = 283となっています。この値は、「タイプ」のうち標本サイズが小さいほうの水準(「Pharmaceutical」)のオブザベーションの順位の和です。「2群での母集団分布が同じである」という仮定のもとで、Sとその期待値との差の絶対値が、観測された値(観測されたSとその期待値との差の絶対値)以上となる確率は、0.0005です。これは、Wilcoxon検定の両側検定に対する結果であり、「利益の分布が「タイプ」によって異ならない」という帰無仮説を棄却する根拠となります。
この例では、外れ値があるので、Wilcoxon検定のほうが分散分析や分散が異なるt検定よりも適切でしょう。Wilcoxon検定は、32行目の大きな値の影響を受けにくく、正規分布を前提としていないからです。