單因子變異數分析

什麼是單因子變異數分析 (ANOVA)？

單因子變異數分析 (ANOVA) 是一種用於檢定三種以上群組平均數差異的統計方法。

如何運用單因子變異數分析 (ANOVA)？

當您有單一獨立變異數或因子，且目標是查證變異數或不同程度的因子是否對應變數造成可衡量的影響時，可以使用單因子變異數分析 (ANOVA)。

需要考量的限制有哪些？

單因子變異數分析，只能用於查證單一因子與單一應變數。比較三個或多個群組的平均數時，此方法可以告訴我們是否至少有一對平均數存在顯著差異，但無法告訴我們是哪一組平均數有差異。此外，各群組的應變數也必須為常態分佈，且各群組的群組內變異性必須相似。

單因子變異數分析用於檢定群組平均數的差異

單因子變異數分析是一種檢定虛無假設的統計方法 (H0)，此虛無假設假設三個或以上的母體平均數相等，而替代假設 (H_a) 則是至少有一個平均數不相等。k 個平均數的統計假設形式符號寫法為：

$H_0:\mu_1=\mu_2=\cdots=\mu_k$

$H_a:\mathrm{not\mathrm{\ }all\ means\ are\ equal}$

而 μi是第i 群組因子的平均數。

好，也許您正在想，在什麼情況下需要判斷多個母體的平均數是否相同或相異呢？常見的情況之一是，您會懷疑特定的獨立流程變數是導致該流程重要成果的原因。例如：您可能懷疑不同的生產批次、作業員或原物料批次如何影響製造流程的輸出成果 (也就是品質衡量結果)。

若要測試您的懷疑，可以執行使用三個或多個變數 (也就是層級) 執行獨立變數 (也就是因子) 的流程，然後從每次執行結果取樣。若您用單因子變異數分析比較各群組平均數時發現差異(假設其他環節都沒有出錯的話！)，則代表您有證據佐證您的懷疑是正確的 -- 您調查的因子很可能對結果造成影響！

單因子變異數分析範例

讓我們一起深入探究單因子變異數分析範例。試想您為一家製造小罐裝黏著劑的公司工作。這種黏膠的黏稠度相當重要：太稠會不好塗抹；太稀則會黏性不足。最近有幾位不甚滿意的新客戶向您提出意見，表示黏著劑的黏稠度不如以往穩定。老闆要求您進行調查。

您決定最好先從檢驗最近五批產品的平均黏稠度開始。如果您在這幾批產品中發現差異，那很可能代表確實有發生問題。先假設有哪些因子可能造成批次間黏稠度不同，也許會有所幫助。

您將一個測量黏稠度的轉軸儀器浸泡至黏著劑罐子裡，用來測量黏著劑的黏稠度。此檢定為量測黏著劑的抗扭力。您檢定了從最近五批次產品中隨機取樣的五罐黏著劑。您收集到每一罐黏著劑的抗扭力資料，並將資料製作成圖表。

圖 1：各批次的抗扭力圖表

從資料圖表中，您觀察到批次 3 罐子的抗扭力相較於其他批次的抗扭力低。當您計算所有抗扭力資料的平均數時，您發現批次 3 的抗扭力為 26.77，遠低於其他四個批次-平均約為30。

表 1：從五個批次黏著劑檢定中得出的抗扭力平均數

批次編號	N	平均數
1	5	29.65
2	5	30.43
3	5	26.77
4	5	30.42
5	5	29.37

變異數分析表格

變異數分析結果通常會顯示在變異數分析表格中。變異數分析表格包含：

來源：變異數來源包含檢驗因子 (在這個例子是不同批次的產品)、誤差與總計。
DF：各變異來源的自由度。
差值平方和：各變異來源的差值平方和 (SS) 與所有來源的總計。
均方：差值平方和除以其相關的自由度。
F 比例：因子 (批次) 的均方除以誤差的均方。
機率 > F：p 值。

表 2：包含抗扭力檢定結果的變異數分析表格

來源	DF	差值平方和	均方	F 比例	機率 > F
批次	4	45.25	11.31	6.90	0.0012
誤差	20	32.80	1.64
總計	24	78.05

我們將於下方說明此表格中的各項元素如何產出。我們現在要將重點放在此表格中的一項關鍵元素：p 值。p 值用於評估認定所有平均數皆相同的虛無假設有效性。在我們的範例中，p 值 (機率 > F) 為 0.0012。因為此 p 值較小，所以可以作為平均數並非全部相等的證據。我們的樣本提供證據，證明在五個批次中的一個或多個批次之間，平均抗扭力值有所差異。

什麼是 p 值？

p 值用於測量假設檢定的可能性。假設檢定的目標，在於判斷是否有足夠的證據佐證特定的資料假設。讓我們回憶一下，使用變異數分析時，我們做出兩個假設：所有平均數都相等的 虛無假設 以及平均數不相等的 替代假設。

因為我們只檢驗從全體母體擷取的隨機樣本，因此可能會面臨樣本平均數無法代表全體母體平均數的風險。p 值可幫助我們量化風險。p 值代表樣本資料平均數出現差異的可能性純屬機率，具體來說，p 值代表當虛無假設為真 (全體母體平均數實際上相等) 時，觀察到的樣本平均數變異值至少會跟您測量的結果一樣大的可能性。

p 值較小則否定虛無假設。否定虛無假設的臨界值為 0.05。也就是說，如果您的 p 值小於 0.05，就可以否定虛無假設，並選擇至少有一個平均數與其他不同的替代假設。

根據這些結果，您決定要保留批次 3 來做進一步檢定。您可能在報告中寫下：我們從最近五個批次測量五罐產品的抗扭力。從觀察中發現的變異數分析支持批次間平均抗扭力有差異 (p = 0.0012)。資料圖表顯示批次 3 比起其他批次，平均抗扭力較低 (26.77)。我們會保留批次 3 進行進一步的評估。

切記，變異數分析檢定無法告訴您哪一組或多組平均數與其他有差異，且 (和我們的範例不同)，從資料圖表上也不一定能顯著看出差異。使用多重比較檢定是尋找特定群組間是否具有差異的方法之一。舉例來說，若要比較群組平均數與整體平均數，您可以使用平均數分析 (ANOM)。若要比較個別平均數配對，您可以使用 Tukey-Kramer 多重比較檢定。

單因子變異數分析計算

現在，讓我們來深入探索範例中討論的抗扭力檢定。讓我們回憶一下，我們一共有五批次的材料。每個批次我們都隨機選擇了五罐來進行檢定。這叫做單因子設計。這個單因子，也就是批次，有五個層級。各層級都會重複 (檢定) 五次。檢定結果如下。

表 3：各批次的抗扭力測量結果

	批次 1	批次 2	批次 3	批次 4	批次 5
罐 1	29.39	30.63	27.16	31.03	29.67
罐 2	31.51	32.10	26.63	30.98	29.32
罐 3	30.88	30.11	25.31	28.95	26.87
罐 4	27.63	29.63	27.66	31.45	31.59
罐 5	28.85	29.68	27.10	29.70	29.41
平均數	29.65	30.43	26.77	30.42	29.37

為了探索上方變異數分析表 (表 2) 中的計算結果，讓我們首先建立以下定義：

$n_i$ = 處理 $i$ 的觀察數量 (如我們的範例，批次 $i$ )

$N$ = 觀察總數

$Y_{ij}$ = i^th 處理的 j^th 觀察

$\overline{Y}_i$ = i^th 處理的樣本平均數

$\overline{\overline{Y}}$ = 所有觀察的平均數 (總平均數)

差值平方和

瞭解這些定義後，讓我們一起來看看變異數分析表格中的差值平方和欄。差值平方和讓我們能夠聚焦於資料集中不同資料點的差異，以及所有資料點的平均數，進而量化資料的變異性。下方的公式將整體變異性分為兩個部分：因為模型或因子而產生的變異性，與因為隨機誤差而產生的變異性。

$\sum_{i=1}^{a}\sum_{j=1}^{n_i}(Y_{ij}-\overline{\overline{Y}})^2\;=\;\sum_{i=1}^{a}n_i(\overline{Y}_i-\overline{\overline{Y}})^2+\sum_{i=1}^{a}\sum_{j=1}^{n_i}(Y_{ij}-\overline{Y}_i)^2$

$SS(總計)\; = \;SS(因子)\; + \;SS(誤差)$

雖然方程式可能很複雜，將重點放在個別元素會更容易掌握。下表 4 列出了公式的每個元素，並加以構成平方，以組成差值平方和。第一欄資料 ( $Y_{ij}$ ) 包含我們於上表 3 收集的抗扭力測量資料。

另一種檢視變異性來源的方法：群組間變異數與群組內變異數

請回憶上述的變異數分析表 (表 2)，來源欄列出了兩個變異數來源：因子 (在我們的範例中為批次) 與誤差。這兩種來源也可以視為 群組間變異數 (對應至因子或處理方式的變異數) 與 群組內變異數 (對應至機率或誤差的變異數)。此術語表示我們的差值平方和(SS)公式基本上為計算群組間差異 (處理方式效應) 與群組內差異 (因機率而產生之無法說明的差異)，而衍生的變異數和。

表 4：差值平方和(SS)計算

批次	$Y_{ij}$	$\overline{Y}_i$	$\overline{\overline{Y}}$	$\overline{Y}_i-\overline{\overline{Y}}$	$Y_{ij}-\overline{\overline{Y}}$	$Y_{ij}-\overline{Y}_i$	$(\overline{Y}_i-\overline{\overline{Y}})^2$	$(Y_{ij}-\overline{Y}_i)^2$	$(Y_{ij}-\overline{\overline{Y}})^2$
1	29.39	29.65	29.33	0.32	0.06	-0.26	0.10	0.07	0.00
1	31.51	29.65	29.33	0.32	2.18	1.86	0.10	3.46	4.75
1	30.88	29.65	29.33	0.32	1.55	1.23	0.10	1.51	2.40
1	27.63	29.65	29.33	0.32	-1.70	-2.02	0.10	4.08	2.89
1	28.85	29.65	29.33	0.32	-0.48	-0.80	0.10	0.64	0.23
2	30.63	30.43	29.33	1.10	1.30	0.20	1.21	0.04	1.69
2	32.10	30.43	29.33	1.10	2.77	1.67	1.21	2.79	7.68
2	30.11	30.43	29.33	1.10	0.78	-0.32	1.21	0.10	0.61
2	29.63	30.43	29.33	1.10	0.30	-0.80	1.21	0.64	0.09
2	29.68	30.43	29.33	1.10	0.35	-0.75	1.21	0.56	0.12
3	27.16	26.77	29.33	-2.56	-2.17	0.39	6.55	0.15	4.71
3	26.63	26.77	29.33	-2.56	-2.70	-0.14	6.55	0.02	7.29
3	25.31	26.77	29.33	-2.56	-4.02	-1.46	6.55	2.14	16.16
3	27.66	26.77	29.33	-2.56	-1.67	0.89	6.55	0.79	2.79
3	27.10	26.77	29.33	-2.56	-2.23	0.33	6.55	0.11	4.97
4	31.03	30.42	29.33	1.09	1.70	0.61	1.19	0.37	2.89
4	30.98	30.42	29.33	1.09	1.65	0.56	1.19	0.31	2.72
4	28.95	30.42	29.33	1.09	-0.38	-1.47	1.19	2.16	0.14
4	31.45	30.42	29.33	1.09	2.12	1.03	1.19	1.06	4.49
4	29.70	30.42	29.33	1.09	0.37	-0.72	1.19	0.52	0.14
5	29.67	29.37	29.33	0.04	0.34	0.30	0.00	0.09	0.12
5	29.32	29.37	29.33	0.04	-0.01	-0.05	0.00	0.00	0.00
5	26.87	29.37	29.33	0.04	-2.46	-2.50	0.00	6.26	6.05
5	31.59	29.37	29.33	0.04	2.26	2.22	0.00	4.93	5.11
5	29.41	29.37	29.33	0.04	0.08	0.04	0.00	0.00	0.01
差值平方和							SS (因子) = 45.25	SS (誤差) = 32.80	SS (總計) = 78.05

自由度 (DF)

與各差值平方相關的數量為自由度 (DF)。自由度為用於計算各差值平方的獨立資訊數量。使用 k 級 (在我們的範例中為五個批次) 因子進行單因子設計，且觀察總數為 N (每批次 5 罐，總計 25 罐)，自由度如下：

表 5：判斷自由度

	自由度 (DF) 公式	計算自由度
SS (因子)	k - 1	5 - 1 = 4
SS (誤差)	N - k	25 - 5 = 20
SS (總計)	N - 1	25 - 1 = 24

均方 (MS) 與 F 比例

我們將各差值平方除以對應的自由度以取得均方。當虛無假設為真 (即平均數相等) 時，MS (因子) 與 MS (誤差) 都是誤差變異的預估值，且大小應該大致相同。其比例或 F 比例應接近 1。若虛無假設並非為真，那麼 MS (因子) 將大於 MS (誤差)，且其比例將大於 1。以我們的黏著劑檢定為例，計算出的 F 比例為 6.90，明顯指出平均數相等的虛無假設不正確。

表 6：計算均方與 F 比例

	差值平方和 (SS)	自由度 (DF)	均方	F 比例
SS (因子)	45.25	4	45.25/4 = 11.31	11.31/1.64= 6.90
SS (誤差)	32.80	20	32.80/20 = 1.64

MS (因子) 對 MS (誤差) 的比例，也就是 F 比例，具有 F 分佈。F 分佈是當虛無假設 (也就是平均數相等) 為真時，我們預期觀察到的 F 值分佈。F 分佈的形狀會因兩個參數而異，這兩個參數分別為自由度的分母與分子。在變異數分析檢定中，分母為 MS (因子)，因此自由度與 MS (因子) 相關。分子為 MS (誤差)，所以自由度分子與 MS (誤差) 相關。

如果您計算出的 F 比例超過對應 F 分佈的預期值，假設 p 值足夠小，您可以否定平均數相等的虛無假設。在此情況下，p 值即為當虛無假設為真時，觀察到的 F 比例會比 F 分佈值更大的機率。