一元配置分散分析
一元配置分散分析とは
一元配置分散分析(ANOVA)とは、3群以上の平均の差を検定するための統計的方法です。
一元配置分散分析の使用方法
一元配置分散分析は通常、単一の独立変数または因子を持ち、変動または因子の異なる水準が従属変数に測定可能な効果を持つかどうかを調べるために用いられます。
考慮すべき制約とは
一元配置分散分析は、因子が1つ、従属変数が1つの場合にのみ使用できます。3群以上の平均を比較すると、平均の少なくとも1つのペアに有意差があることが分かりますが、それがどのペアかは判別できません。また、従属変数が各群で正規分布し、群内のばらつきが群間で類似している必要があります。
一元配置分散分析は群ごとの平均の差の検定です
一元配置分散分析は、3つ以上の母平均が等しいという帰無仮説(H0)を、少なくとも1つの平均に差があるという対立仮説(Ha)に対して検定する統計的手法です。統計的仮説の正式な表記法を使用すると、k 個の平均の場合は次のように記述されます。
$ H_0:\mu_1=\mu_2=\cdots=\mu_k $
$ H_a:\mathrm{not\mathrm{\ }all\ means\ are\ equal} $
ここで、$\mu_i$は因子のi番目の水準の平均です。
さて、複数の母集団の平均が同じか否かを判断する必要があるのはどういった場合なのか、とお考えかもしれません。一般的には、ある独立した工程変数がその工程の重要な結果の要因ではないかと疑っている場合があてはまります。たとえば、異なる生産ロット、オペレーター、または原材料のバッチが生産工程の出力(品質測定)に与える影響について疑いがあるとします。
この疑いを検定するには、この独立変数(因子)の3つ以上のバリエーション(水準)を使用して工程を実行し、各実行の結果から観測値のサンプルを取得します。分散分析を使用して各群の観測値の平均を比較した時に差があった場合(すべてが正しく行われたと仮定した場合)、その疑いが正しかったという証拠が得られます。つまり、調査した因子が結果に影響を与えていると考えられます。
一元配置分散分析の例
一元配置分散分析の例をさらに詳しく見ていきましょう。小瓶で販売する接着剤を製造している会社で働いているとします。接着剤の粘度は重要です。高すぎると塗布が困難になり、低すぎると接着性が低下します。最近、不満を抱く何人かの顧客から、接着剤の粘度が以前と比べて一貫していないというフィードバックをいくつか受け取りました。あなたは上司から調査を依頼されました。
最初のステップとして、直近の5つの生産ロットの平均粘度を調べることにしました。ロット間に違いがあった場合、この問題が本当であることを確認できると思われます。また、ロット間の不整合を引き起こす可能性のある因子についての仮説を立て始めるのに役立つ場合もあります。
接着剤の瓶に浸したスピンドルを回転させる機器を使用して粘度を測定します。このテストにより、トルク抵抗と呼ばれる測定値が得られます。最新の5つのロットのそれぞれからランダムに選択された5つの瓶をテストします。各瓶のトルク抵抗の測定値を取得し、データをプロットします。
データのプロットから、ロット3の瓶のトルク測定値は、他のロットから取得したサンプルのトルク測定値よりも低い傾向があることがわかります。すべての測定値から平均を計算すると、ロット3の平均トルクは26.77で、他の4つの各ロットの平均(約30)よりもはるかに低くなっています。
表1: 5ロットの接着剤のテストにおけるトルク測定値の平均
ロット番号 | N | 平均 |
---|---|---|
1 | 5 | 29.65 |
2 | 5 | 30.43 |
3 | 5 | 26.77 |
4 | 5 | 30.42 |
5 | 5 | 29.37 |
分散分析表
分散分析の結果は通常分散分析表に表示されます。分散分析表には以下の項目が含まれます。
- 要因: 調査中の因子(この場合はロット)、誤差、合計を含む変動の要因。
- DF: 変動の各要因の自由度。
- 平方和: 変動の各要因の平方和(SS)とすべての要因の平方和の合計。
- 平均平方: 平方和を関連する自由度で割った値。
- F値: 因子(ロット)の平均平方を誤差の平均平方で割った値。
- 確率> F: p値。
表2: トルク測定値の結果を含む分散分析表
要因 | 自由度 | 平方和 | 平均平方 | F値 | p値(Prob>F) |
---|---|---|---|---|---|
ロット | 4 | 45.25 | 11.31 | 6.90 | 0.0012 |
誤差 | 20 | 32.80 | 1.64 | ||
合計 | 24 | 78.05 |
この表の成分がどのように取得されるかについて、以下で説明します。ここで、この表で注目すべき重要な要素の1つがp値です。p値は、すべての平均が同じであるという帰無仮説の妥当性を評価するために使用されます。この例では、p値(Prob > F)は0.0012です。このようにp値が小さいことは、平均値がすべて同じではないことの証拠と見なすことができます。このサンプルは、5つのロットのうち1つ以上のロット間でトルク抵抗値の平均に違いがあることの証拠となります。
p値とは
p値は、仮説検定に使用される確率の尺度です。仮説検定の目標は、データに関する特定の仮説を支持するのに十分な証拠があるかどうかを判断することです。分散分析を使用して、すべての平均が等しいという帰無仮説と、すべての平均が等しいわけではないという対立仮説の2つの仮説を立てたことを思い出してください。
全母集団から抽出されたデータのランダムなサンプルのみを調査しているため、サンプルの平均が全母集団の平均を表していない可能性があります。p値は、その可能性を定量化する手段になります。これは、サンプルデータの平均のばらつきが純粋な偶然の結果である確率です。具体的には、帰無仮説が実際に真である(つまり全母集団の平均が実際に等しい)場合に、測定された値と少なくとも同じ大きさのばらつきが標本平均間に観察される確率です。
p値が小さい場合、帰無仮説は棄却されます。帰無仮説を棄却するための一般的な閾値は0.05です。つまり、p値が0.05未満の場合、少なくとも1つの平均が他の平均と異なるという対立仮説を支持して、帰無仮説を棄却します。
これらの結果に基づいて、あなたはロット3を詳細に調べることを決めました。レポートには次のように記述します。製品の5つの瓶のトルクは、直近の5つの生産ロットのそれぞれから測定されました。分散分析では、観測値がロット間の平均トルクの違いを支持していることがわかりました(p = 0.0012)。データのプロットは、他の4つのロットと比較して、ロット3の平均トルクが低い(26.77)ことを示しています。ロット3に対して詳細な評価を行います。
分散分析では、どの平均が他と異なるかはわかりません。また、(この例は異なりますが)これはデータのプロットから常に明らかになるとは限りません。特定のタイプの差異に関する問題に答える1つの方法は、多重比較検定を使用することです。たとえば平均分析(ANOM)を使用すると、群ごとの平均を全体平均と比較することができます。Tukey-Kramerの多重比較検定を使用すると、平均の個々のペアを比較することができます。
一元配置分散分析の計算
それでは、トルク測定の例をさらに詳しく見てみましょう。5つのロットの試料がありましたね。各ロットから、テスト用に5つの瓶をランダムに選択しました。これを1因子計画と呼びます。唯一の因子であるロットには5つの水準があります。各水準は5回反復してテストされます。テストの結果は以下のようになりました。
表3: ロット単位のトルク測定値
ロット1 | ロット2 | ロット3 | ロット4 | ロット5 | |
---|---|---|---|---|---|
瓶1 | 29.39 | 30.63 | 27.16 | 31.03 | 29.67 |
瓶2 | 31.51 | 32.10 | 26.63 | 30.98 | 29.32 |
瓶3 | 30.88 | 30.11 | 25.31 | 28.95 | 26.87 |
瓶4 | 27.63 | 29.63 | 27.66 | 31.45 | 31.59 |
瓶5 | 28.85 | 29.68 | 27.10 | 29.70 | 29.41 |
平均 | 29.65 | 30.43 | 26.77 | 30.42 | 29.37 |
上記の分散分析表(表2)の計算結果を調べるため、まず次を定義しましょう。
$n_i$ = 処置$i$(この例ではロット$i$)の観測度数
$N$ = 全観測度数
$Y_{ij}$ = i番目の処置のj番目の観測値
$\overline{Y}_i$ = i番目の処置の標本平均
$\overline{\overline{Y}}$ = すべての観測値の平均(全体平均)
平方和
これらの定義を念頭に置いて、分散分析表の平方和の列を見てみましょう。平方和を用いて、各データ点とデータセット内のすべてのデータ点の平均との差に注目して、データセット内のばらつきを定量化することができます。以下の式で、全体のばらつきを、モデルまたは因子水準に起因するばらつきと、誤差に起因するばらつきの2つの部分に分割します。
$$ \sum_{i=1}^{a}\sum_{j=1}^{n_i}(Y_{ij}-\overline{\overline{Y}})^2\;=\;\sum_{i=1}^{a}n_i(\overline{Y}_i-\overline{\overline{Y}})^2+\sum_{i=1}^{a}\sum_{j=1}^{n_i}(Y_{ij}-\overline{Y}_i)^2 $$
$$ SS(Total)\; = \;SS(Factor)\; + \;SS(Error) $$
この方程式は複雑に見えるかもしれませんが、各要素を個別に注目していくとはるかに理解しやすくなります。以下の表4では計算式の各成分を示し、それらを使用して、平方和を構成する2乗項を構築しています。データの最初の列($Y_{ij}$)には、上記の表3で収集したトルク測定値が含まれています。
ばらつきの原因を調べる別の方法: 群間変動と群内変動
上記の分散分析表(表2)の要因の列には、因子(この例ではロット)と誤差の2つの変動の要因がリストされていました。これら2つの要因を考えるもう1つの方法が、群間変動(因子または処置に起因する変動に相当)と群内変動(偶然または誤差に起因する変動に相当)です。そしてこの用語を使用すると、平方和の計算式は基本的に、群間の差に起因する変動(処置効果)と各群内の差に起因する変動(偶然に起因する説明のできない差)の合計の計算になります。
表4: 平方和の計算
ロット | $Y_{ij} $ | $\overline{Y}_i $ | $\overline{\overline{Y}}$ | $\overline{Y}_i-\overline{\overline{Y}}$ | $Y_{ij}-\overline{\overline{Y}}$ | $Y_{ij}-\overline{Y}_i $ | $(\overline{Y}_i-\overline{\overline{Y}})^2 $ | $(Y_{ij}-\overline{Y}_i)^2 $ | $(Y_{ij}-\overline{\overline{Y}})^2 $ |
---|---|---|---|---|---|---|---|---|---|
1 | 29.39 | 29.65 | 29.33 | 0.32 | 0.06 | -0.26 | 0.10 | 0.07 | 0.00 |
1 | 31.51 | 29.65 | 29.33 | 0.32 | 2.18 | 1.86 | 0.10 | 3.46 | 4.75 |
1 | 30.88 | 29.65 | 29.33 | 0.32 | 1.55 | 1.23 | 0.10 | 1.51 | 2.40 |
1 | 27.63 | 29.65 | 29.33 | 0.32 | -1.70 | -2.02 | 0.10 | 4.08 | 2.89 |
1 | 28.85 | 29.65 | 29.33 | 0.32 | -0.48 | -0.80 | 0.10 | 0.64 | 0.23 |
2 | 30.63 | 30.43 | 29.33 | 1.10 | 1.30 | 0.20 | 1.21 | 0.04 | 1.69 |
2 | 32.10 | 30.43 | 29.33 | 1.10 | 2.77 | 1.67 | 1.21 | 2.79 | 7.68 |
2 | 30.11 | 30.43 | 29.33 | 1.10 | 0.78 | -0.32 | 1.21 | 0.10 | 0.61 |
2 | 29.63 | 30.43 | 29.33 | 1.10 | 0.30 | -0.80 | 1.21 | 0.64 | 0.09 |
2 | 29.68 | 30.43 | 29.33 | 1.10 | 0.35 | -0.75 | 1.21 | 0.56 | 0.12 |
3 | 27.16 | 26.77 | 29.33 | -2.56 | -2.17 | 0.39 | 6.55 | 0.15 | 4.71 |
3 | 26.63 | 26.77 | 29.33 | -2.56 | -2.70 | -0.14 | 6.55 | 0.02 | 7.29 |
3 | 25.31 | 26.77 | 29.33 | -2.56 | -4.02 | -1.46 | 6.55 | 2.14 | 16.16 |
3 | 27.66 | 26.77 | 29.33 | -2.56 | -1.67 | 0.89 | 6.55 | 0.79 | 2.79 |
3 | 27.10 | 26.77 | 29.33 | -2.56 | -2.23 | 0.33 | 6.55 | 0.11 | 4.97 |
4 | 31.03 | 30.42 | 29.33 | 1.09 | 1.70 | 0.61 | 1.19 | 0.37 | 2.89 |
4 | 30.98 | 30.42 | 29.33 | 1.09 | 1.65 | 0.56 | 1.19 | 0.31 | 2.72 |
4 | 28.95 | 30.42 | 29.33 | 1.09 | -0.38 | -1.47 | 1.19 | 2.16 | 0.14 |
4 | 31.45 | 30.42 | 29.33 | 1.09 | 2.12 | 1.03 | 1.19 | 1.06 | 4.49 |
4 | 29.70 | 30.42 | 29.33 | 1.09 | 0.37 | -0.72 | 1.19 | 0.52 | 0.14 |
5 | 29.67 | 29.37 | 29.33 | 0.04 | 0.34 | 0.30 | 0.00 | 0.09 | 0.12 |
5 | 29.32 | 29.37 | 29.33 | 0.04 | -0.01 | -0.05 | 0.00 | 0.00 | 0.00 |
5 | 26.87 | 29.37 | 29.33 | 0.04 | -2.46 | -2.50 | 0.00 | 6.26 | 6.05 |
5 | 31.59 | 29.37 | 29.33 | 0.04 | 2.26 | 2.22 | 0.00 | 4.93 | 5.11 |
5 | 29.41 | 29.37 | 29.33 | 0.04 | 0.08 | 0.04 | 0.00 | 0.00 | 0.01 |
平方和 | SS(因子)= 45.25 | SS(誤差)= 32.80 | SS(合計)= 78.05 |
自由度(DF)
各平方和に関連付けられているのが、自由度(DF)と呼ばれる数値です。自由度は、各平方和の計算に使用される、独立した情報の数を示します。k水準の因子(この例では5ロット)と合計N個の観測値(ロットあたり5つの瓶、合計25)の1因子計画の場合、自由度は次のようになります。
表5: 自由度の決定
自由度(DF)の計算式 | 計算された自由度 | |
---|---|---|
SS(因子) | k - 1 | 5 - 1 = 4 |
SS(誤差) | N - k | 25 - 5 = 20 |
SS(合計) | N - 1 | 25 - 1 = 24 |
平均平方(MS)とF値
各平方和を、対応する自由度で割って平均平方を求めます。帰無仮説が真の場合(つまり、平均が等しい場合)、MS(因子)とMS(誤差)はどちらも誤差の分散の推定値であり、ほぼ同じサイズになります。それらの比(F値)は1に近くなります。帰無仮説が真でない場合、MS(因子)はMS(誤差)より大きく、それらの比は1より大きくなります。接着剤の検定の例では、計算されたF値6.90は、平均が等しいという帰無仮説に反する有意な証拠を示しています。
表6: 平均平方とF値の計算
平方和(SS) | 自由度(DF) | 平均平方 | F値 | |
---|---|---|---|---|
SS(因子) | 45.25 | 4 | 45.25/4 = 11.31 | 11.31/1.64= 6.90 |
SS(誤差) | 32.80 | 20 | 32.80/20 = 1.64 |
MS(因子)とMS(誤差)の比(F値)はF分布に従います。F分布は、帰無仮説が真である(平均が等しい)ときに観測されると予想されるF値の分布です。F分布は、分子と分母の自由度という2つのパラメータに基づいて異なる形状を持ちます。分散分析の場合、分子はMS(因子)であるため、自由度はMS(因子)に関連するものです。分母はMS(誤差)であるため、分母の自由度はMS(誤差)に関連するものです。
計算されたF値が対応するF分布から期待される値を超える場合、p値が十分に小さければ、平均が等しいという帰無仮説を棄却します。この場合のp値は、実際に帰無仮説が真である場合に、F値より大きい値をF分布から観測する確率です。