Zスコア
Zスコアとは?
Zスコアは、特定のデータ値が正規分布に従うデータセットの平均からどれだけ離れているかを示す標準化された尺度です。
Zスコアの使用方法
Zスコアは、特定のデータポイントが平均に対してどの程度極端であるかを表す一様な尺度を提供することで、外れ値を識別したり、異なる分布からのデータを比較したりするのに役立ちます。また、Zスコアは、経験則をすばやく適用する方法でもあります。たとえば、Zスコアが-2から2の間の値の割合を確認することで、データセットの値の95%が2標準偏差内にあるかどうかをすばやく確認できます。
Zスコアの計算方法
Zスコアは、データ値から平均値を引き、標準偏差で割って計算します。
Zスコアの使用
統計ソフトウェアを使用してZスコアを計算する方法をご覧ください。
- JMPをダウンロードし、ソフトウェアに含まれているサンプルデータを使用して操作を進めてください。
- その他のJMP チュートリアルについては、 JMPラーニングライブラリをご覧ください。
Zスコアは、標準化された尺度を使用して、各データ値が平均からどれだけ離れているかを測定する方法です。Zスコアは、生データをZ分布のデータに変換します。Z分布は、平均が0で標準偏差が1の正規分布です。これは、標準正規分布と呼ばれることがよくあります。
Zスコアに変換する理由
Zスコアに変換すると、経験則を適用しやすくなります。たとえば、Z分布の標準偏差は1なので、値の約95%が-2から+2の間にあることがわかります。
Zスコアに変換すると、標準化された尺度で平均からの距離を判断できます。コンピュータが広く普及する以前は、統計学の教科書には標準化された正規分布のテーブルが記載されており、学生は経験則の1、2、3標準偏差よりも正確な平均からの距離を調べることができました。
Zスコアへの変換方法
データ値をZスコアに変換するには、値から平均値を引いて、標準偏差で割ります。結果は、Zスコアまたは「標準化スコア」と呼ばれます。理論的には、母集団の平均と標準偏差を使用しますが、実際には、通常、標本平均と標本標準偏差を使用します。
例を見ると理解しやすいでしょう。
簡単な例として、いくつかのデータ値のみを使用します。心拍数を測定するとします。ほとんどの人の心拍数は 1 分あたり60~100 拍 (BPM) です。データ値が次のようになっているとします。
55 |
60 |
65 |
75 |
80 |
85 |
これらの値の平均は70で、標準偏差は11.8です。(これらの計算の実行方法については、平均と標準偏差のページで確認できます。)
55という値が2つの標準偏差の範囲内にあるかどうかを尋ねられたとします。平均と標準偏差を使って、70から2標準偏差離れた値を計算すれば、この答えがわかります。計算は次のようになります。
70 – (2 x 11.8) = 70 – 23.6 = 46.4
55は46.4から70の範囲内にあるため、55は平均の2標準偏差以内に収まります。
または、Zスコアを計算することもできます。値のセットのZスコアを計算するには、各値から平均を引き、標準偏差で割ります。心拍数測定のZスコアは次のとおりです。
データ | Z-スコア |
55 | (55 – 70) / 11.8 = –1.27 |
60 | (60 – 70) / 11.8 = –0.85 |
65 | (65 – 70) / 11.8 = –0.42 |
75 | (75 – 70) / 11.8 = 0.42 |
80 | (80 – 70) / 11.8 = 0.85 |
85 | (85 – 70) / 11.8 = 1.27 |
ここでは、55という値が2標準偏差以内に収まることがわかります。実際、平均を1.27標準偏差下回っています。
統計学の理論は母集団の平均と母集団の標準偏差に基づいていますが、ここでは標本平均と標本標準偏差を使ってZスコアを計算しました。