單因子變異數分析

什麼是單因子變異數分析 (ANOVA)?

單因子變異數分析 (ANOVA) 是一種用於檢定三種以上群組平均數差異的統計方法。

如何運用單因子變異數分析 (ANOVA)?

當您有單一獨立變異數或 因子,且目標是查證變異數或不同 程度 的因子是否對應變數造成可衡量的影響時,可以使用單因子變異數分析 (ANOVA)。

需要考量的限制有哪些?

單因子變異數分析,只能用於查證單一因子與單一應變數。比較三個或多個群組的平均數時,此方法可以告訴我們是否至少有一對平均數存在顯著差異,但無法告訴我們是哪一組平均數有差異。此外,各群組的應變數也必須為常態分佈,且各群組的群組內變異性必須相似。

單因子變異數分析用於檢定群組平均數的差異

單因子變異數分析是一種檢定虛無假設的統計方法 (H0),此虛無假設假設三個或以上的母體平均數相等,而替代假設 (Ha) 則是至少有一個平均數不相等。k 個平均數的統計假設形式符號寫法為:

H0:μ1=μ2==μk

Ha:not all means are equal

而 μi是 第i 群組因子的平均數。

好,也許您正在想,在什麼情況下需要判斷多個母體的平均數是否相同或相異呢?常見的情況之一是,您會懷疑特定的獨立流程變數是導致該流程重要成果的原因。例如:您可能懷疑不同的生產批次、作業員或原物料批次如何影響製造流程的輸出成果 (也就是品質衡量結果)。

若要測試您的懷疑,可以執行使用三個或多個變數 (也就是層級) 執行獨立變數 (也就是因子) 的流程,然後從每次執行結果取樣。若您用單因子變異數分析比較各群組平均數時發現差異(假設其他環節都沒有出錯的話!),則代表您有證據佐證您的懷疑是正確的 -- 您調查的因子很可能對結果造成影響!

單因子變異數分析範例

讓我們一起深入探究單因子變異數分析範例。試想您為一家製造小罐裝黏著劑的公司工作。這種黏膠的黏稠度相當重要:太稠會不好塗抹;太稀則會黏性不足。最近有幾位不甚滿意的新客戶向您提出意見,表示黏著劑的黏稠度不如以往穩定。老闆要求您進行調查。

您決定最好先從檢驗最近五批產品的平均黏稠度開始。如果您在這幾批產品中發現差異,那很可能代表確實有發生問題。先假設有哪些因子可能造成批次間黏稠度不同,也許會有所幫助。

您將一個測量黏稠度的轉軸儀器浸泡至黏著劑罐子裡,用來測量黏著劑的黏稠度。此檢定為量測黏著劑的抗扭力。您檢定了從最近五批次產品中隨機取樣的五罐黏著劑。您收集到每一罐黏著劑的抗扭力資料,並將資料製作成圖表。

圖 1:各批次的抗扭力圖表

從資料圖表中,您觀察到批次 3 罐子的抗扭力相較於其他批次的抗扭力低。當您計算所有抗扭力資料的平均數時,您發現批次 3 的抗扭力為 26.77,遠低於其他四個批次-平均約為30。

表 1:從五個批次黏著劑檢定中得出的抗扭力平均數

批次編號

N

平均數

1

5

29.65

2

5

30.43

3

5

26.77

4

5

30.42

5

5

29.37

變異數分析表格

變異數分析結果通常會顯示在變異數分析表格中。變異數分析表格包含:

  • 來源:變異數來源包含檢驗因子 (在這個例子是不同批次的產品)、誤差與總計。
  • DF:各變異來源的自由度。
  • 差值平方和:各變異來源的差值平方和 (SS) 與所有來源的總計。
  • 均方:差值平方和除以其相關的自由度。
  • F 比例:因子 (批次) 的均方除以誤差的均方。
  • 機率 > F:p 值。

表 2:包含抗扭力檢定結果的變異數分析表格

來源

DF

差值平方和

均方

F 比例

機率 > F

批次

4

45.25

11.31

6.90

0.0012

誤差

20

32.80

1.64

總計

24

78.05

我們將於下方說明此表格中的各項元素如何產出。我們現在要將重點放在此表格中的一項關鍵元素:p 值。p 值用於評估認定所有平均數皆相同的虛無假設有效性。在我們的範例中,p 值 (機率 > F) 為 0.0012。因為此 p 值較小,所以可以作為平均數並非全部相等的證據。我們的樣本提供證據,證明在五個批次中的一個或多個批次之間,平均抗扭力值有所差異。

什麼是 p 值?

p 值用於測量假設檢定的可能性。假設檢定的目標,在於判斷是否有足夠的證據佐證特定的資料假設。讓我們回憶一下,使用變異數分析時,我們做出兩個假設:所有平均數都相等的 虛無假設 以及平均數不相等的 替代假設

因為我們只檢驗從全體母體擷取的隨機樣本,因此可能會面臨樣本平均數無法代表全體母體平均數的風險。p 值可幫助我們量化風險。p 值代表樣本資料平均數出現差異的可能性純屬機率,具體來說,p 值代表當虛無假設為真 (全體母體平均數實際上相等) 時,觀察到的樣本平均數變異值至少會跟您測量的結果一樣大的可能性。

p 值較小則否定虛無假設。否定虛無假設的臨界值為 0.05。也就是說,如果您的 p 值小於 0.05,就可以否定虛無假設,並選擇至少有一個平均數與其他不同的替代假設。

根據這些結果,您決定要保留批次 3 來做進一步檢定。您可能在報告中寫下:我們從最近五個批次測量五罐產品的抗扭力。從觀察中發現的變異數分析支持批次間平均抗扭力有差異 (p = 0.0012)。資料圖表顯示批次 3 比起其他批次,平均抗扭力較低 (26.77)。我們會保留批次 3 進行進一步的評估。

切記,變異數分析檢定無法告訴您哪一組或多組平均數與其他有差異,且 (和我們的範例不同),從資料圖表上也不一定能顯著看出差異。使用多重比較檢定是尋找特定群組間是否具有差異的方法之一。舉例來說,若要比較群組平均數與整體平均數,您可以使用平均數分析 (ANOM)。若要比較個別平均數配對,您可以使用 Tukey-Kramer 多重比較檢定。

單因子變異數分析計算

現在,讓我們來深入探索範例中討論的抗扭力檢定。讓我們回憶一下,我們一共有五批次的材料。每個批次我們都隨機選擇了五罐來進行檢定。這叫做單因子設計。這個單因子,也就是批次,有五個層級。各層級都會重複 (檢定) 五次。檢定結果如下。

表 3:各批次的抗扭力測量結果

批次 1

批次 2

批次 3

批次 4

批次 5

罐 1

29.39

30.63

27.16

31.03

29.67

罐 2

31.51

32.10

26.63

30.98

29.32

罐 3

30.88

30.11

25.31

28.95

26.87

罐 4

27.63

29.63

27.66

31.45

31.59

罐 5

28.85

29.68

27.10

29.70

29.41

平均數

29.65

30.43

26.77

30.42

29.37

為了探索上方變異數分析表 (表 2) 中的計算結果,讓我們首先建立以下定義:

ni = 處理 i 的觀察數量 (如我們的範例,批次 i)

N = 觀察總數

Yij = ith 處理的 jth 觀察

Y¯i = ith 處理的樣本平均數

Y¯¯ = 所有觀察的平均數 (總平均數)

差值平方和

瞭解這些定義後,讓我們一起來看看變異數分析表格中的差值平方和欄。差值平方和讓我們能夠聚焦於資料集中不同資料點的差異,以及所有資料點的平均數,進而量化資料的變異性。下方的公式將整體變異性分為兩個部分:因為模型或因子而產生的變異性,與因為隨機誤差而產生的變異性。

i=1aj=1ni(YijY¯¯)2=i=1ani(Y¯iY¯¯)2+i=1aj=1ni(YijY¯i)2

SS()=SS()+SS()

雖然方程式可能很複雜,將重點放在個別元素會更容易掌握。下表 4 列出了公式的每個元素,並加以構成平方,以組成差值平方和。第一欄資料 (Yij) 包含我們於上表 3 收集的抗扭力測量資料。

另一種檢視變異性來源的方法:群組間變異數與群組內變異數

請回憶上述的變異數分析表 (表 2),來源欄列出了兩個變異數來源:因子 (在我們的範例中為批次) 與誤差。這兩種來源也可以視為 群組間變異數 (對應至因子或處理方式的變異數) 與 群組內變異數 (對應至機率或誤差的變異數)。此術語表示我們的差值平方和(SS)公式基本上為計算群組 差異 (處理方式效應) 與群組 差異 (因機率而產生之無法說明的差異),而衍生的變異數和。

表 4:差值平方和(SS)計算

批次

Yij

¯Yi

¯¯Y

¯Yi¯¯Y

Yij¯¯Y

Yij¯Yi

(¯Yi¯¯Y)2

(Yij¯Yi)2

(Yij¯¯Y)2

1

29.39

29.65

29.33

0.32

0.06

-0.26

0.10

0.07

0.00

1

31.51

29.65

29.33

0.32

2.18

1.86

0.10

3.46

4.75

1

30.88

29.65

29.33

0.32

1.55

1.23

0.10

1.51

2.40

1

27.63

29.65

29.33

0.32

-1.70

-2.02

0.10

4.08

2.89

1

28.85

29.65

29.33

0.32

-0.48

-0.80

0.10

0.64

0.23

2

30.63

30.43

29.33

1.10

1.30

0.20

1.21

0.04

1.69

2

32.10

30.43

29.33

1.10

2.77

1.67

1.21

2.79

7.68

2

30.11

30.43

29.33

1.10

0.78

-0.32

1.21

0.10

0.61

2

29.63

30.43

29.33

1.10

0.30

-0.80

1.21

0.64

0.09

2

29.68

30.43

29.33

1.10

0.35

-0.75

1.21

0.56

0.12

3

27.16

26.77

29.33

-2.56

-2.17

0.39

6.55

0.15

4.71

3

26.63

26.77

29.33

-2.56

-2.70

-0.14

6.55

0.02

7.29

3

25.31

26.77

29.33

-2.56

-4.02

-1.46

6.55

2.14

16.16

3

27.66

26.77

29.33

-2.56

-1.67

0.89

6.55

0.79

2.79

3

27.10

26.77

29.33

-2.56

-2.23

0.33

6.55

0.11

4.97

4

31.03

30.42

29.33

1.09

1.70

0.61

1.19

0.37

2.89

4

30.98

30.42

29.33

1.09

1.65

0.56

1.19

0.31

2.72

4

28.95

30.42

29.33

1.09

-0.38

-1.47

1.19

2.16

0.14

4

31.45

30.42

29.33

1.09

2.12

1.03

1.19

1.06

4.49

4

29.70

30.42

29.33

1.09

0.37

-0.72

1.19

0.52

0.14

5

29.67

29.37

29.33

0.04

0.34

0.30

0.00

0.09

0.12

5

29.32

29.37

29.33

0.04

-0.01

-0.05

0.00

0.00

0.00

5

26.87

29.37

29.33

0.04

-2.46

-2.50

0.00

6.26

6.05

5

31.59

29.37

29.33

0.04

2.26

2.22

0.00

4.93

5.11

5

29.41

29.37

29.33

0.04

0.08

0.04

0.00

0.00

0.01

差值平方和

SS (因子) = 45.25

SS (誤差) = 32.80

SS (總計) = 78.05

自由度 (DF)

與各差值平方相關的數量為自由度 (DF)。自由度為用於計算各差值平方的獨立資訊數量。使用 k 級 (在我們的範例中為五個批次) 因子進行單因子設計,且觀察總數為 N (每批次 5 罐,總計 25 罐),自由度如下:

表 5:判斷自由度

自由度 (DF) 公式

計算自由度

SS (因子)

k - 1

5 - 1 = 4

SS (誤差)

N - k

25 - 5 = 20

SS (總計)

N - 1

25 - 1 = 24

均方 (MS) 與 F 比例

我們將各差值平方除以對應的自由度以取得均方。當虛無假設為真 (即平均數相等) 時,MS (因子) 與 MS (誤差) 都是誤差變異的預估值,且大小應該大致相同。其比例或 F 比例應接近 1。若虛無假設並非為真,那麼 MS (因子) 將大於 MS (誤差),且其比例將大於 1。以我們的黏著劑檢定為例,計算出的 F 比例為 6.90,明顯指出平均數相等的虛無假設不正確。

表 6:計算均方與 F 比例

差值平方和 (SS)

自由度 (DF)

均方

F 比例

SS (因子)

45.25

4

45.25/4 = 11.31

11.31/1.64= 6.90

SS (誤差)

32.80

20

32.80/20 = 1.64

MS (因子) 對 MS (誤差) 的比例,也就是 F 比例,具有 F 分佈。F 分佈是當虛無假設 (也就是平均數相等) 為真時,我們預期觀察到的 F 值分佈。F 分佈的形狀會因兩個參數而異,這兩個參數分別為自由度的分母與分子。在變異數分析檢定中,分母為 MS (因子),因此自由度與 MS (因子) 相關。分子為 MS (誤差),所以自由度分子與 MS (誤差) 相關。

如果您計算出的 F 比例超過對應 F 分佈的預期值,假設 p 值足夠小,您可以否定平均數相等的虛無假設。在此情況下,p 值即為當虛無假設為真時,觀察到的 F 比例會比 F 分佈值更大的機率。

表 2:F 分佈