集中趨勢和變異性衡量

什麼是集中趨勢量數?

集中趨勢量數為我們提供了關於資料集中心或平均值的基本資訊,幫助我們確定資料點傾向於聚類的「典型」值。

什麼是變異量數 (measures of variability)?

變異性衡量有助我們瞭解資料點偏離中心趨勢的程度。量化資料集中資料點分佈的能力對於深入瞭解資料並做出明智的決策至關重要。

瞭解集中趨勢衡量

集中趨勢衡量以多種方式用於分析及解釋資料。它們提供單個代表性值,有助於快速瞭解資料集的一般特徵,幫助分析人員瞭解資料趨向於聚類的位置並發現任何離群值。主要衡量標準如下:

平均數、中位數和眾數

  • 平均數:資料集的算術平均值。
  • 中位數:資料按順序排列時的中間值。
  • 眾數:資料集中出現頻率最高的值。

每種集中趨勢的衡量標準都有其優點,且適用於不同的情況。選擇使用哪種衡量標準取決於資料的特徵和分析的具體目標。詳細瞭解如何使用平均數、中位數和眾數

瞭解變異性

雖然集中趨勢側重於「典型」值,但一般來說瞭解資料的分佈程度也很重要。分析圍繞集中趨勢的資料點分佈有助於評估資料品質、比較資料集之間的變異性及識別離群值等作業。

下面列出了與衡量變異性相關的關鍵主題。點擊連結以瞭解更多:

  • 常態分佈:發現資料分佈的理論基礎,即構成許多統計分析基礎的鐘形曲線。
  • 標準差:瞭解如何量化資料點在平均數附近的分佈,進而全面掌握資料分佈情況。
  • 經驗法則:探索 68-95-99.7 法則,這是瞭解常態分佈中特定標準差範圍內資料百分比的準則。
  • z 分數:瞭解 z 分數如何量化資料點相對於平均數的位置,進而促進資料集之間的標準化比較。