經驗法則
定義經驗法則 (the empirical rule)
當您擁有正常資料時,經驗法則可讓您快速理解它。此法則又稱為「68-95-99.7%法則」或「三標準差法則」。法則描述了在平均數 1、2 或 3 個標準差範圍內的資料百分比。
透過參考圖 1 中的常態分佈圖,更容易理解這一點。圖的中心(x 軸上的零)表示資料的平均數。橙色垂直虛線繪製在平均數的 1、2 和 3 個標準差處。
請注意,大約 68% 的資料在平均數的一個標準差範圍內。請記住,常態分佈是理論上的母體分佈。母體標準差使用符號 s。有時,這條法則會表述為「68% 的資料在平均數的 ±s 範圍內」。
同樣,您會發現大約 95% 的資料在平均數的兩個標準差範圍內。這通常表述為「95% 的資料在平均數的 ±2s 範圍內」。
最後,大約 99.7% 的資料在平均數的三個標準差範圍內。這通常表述為「99.7% 的資料在平均數的 ±3s 範圍內」。
在實作中,您很少知道真實的母體平均數或母體標準差。相反,您將使用樣本平均數和樣本標準差進行估計,然後使用此法則。
如何使用經驗法則
您如何套用經驗法則來分析資料?假設資料呈常態分佈,經驗法則可讓您預測測量結果落在特定範圍內的可能性。若發現資料在距離平均數不同標準差範圍內出現的百分比與經驗法則描述的預期百分比有所偏差,那麼這可能是有價值的線索,表明資料可能存在問題。
一種原因可能是資料中存在明顯的離群值。例如,若資料由製造品的特定目標規格(例如以毫米為單位的尺寸)的測量值組成,則可能表示製程控制不善,需要加以重視。
另一種可能是,由於各種原因,樣本不能很好地代表較大的母體,或者樣本量太小。