t検定

t検定とは?

t検定(Studentのt検定とも呼ばれます)は、仮説検定を使用して1つまたは2つの母集団の平均を評価するためのツールです。t検定を使用して、単一のグループが既知の値と異なるかどうか(1標本のt検定)、2つのグループが互いに異なるかどうか(独立した2標本のt検定)、対応のある測定値が有意に異なるかどうか(対応のある、または関連のある標本のt検定)を評価できます。

t検定の使用方法

最初に、検定する仮説を定義し、誤った結論を引き出すリスクをどれだけ許容するかを指定します。たとえば、2つの母集団を比較する場合、それらの平均が同じであるという仮説を立てます。そして、実際には母平均には差がない場合に、「母平均の差が存在する」と結論付けてしまう確率をどれだけ許容するかをあらかじめ決めておきます。次に、データから検定統計量を計算し、それをt分布の理論値と比較します。結果に応じて、帰無仮説を棄却するか、棄却できないかが決まります。

2つ以上のグループがある場合はどうすればよいですか?

t検定は使用できません。多重比較法を使用します。使用できる検定の例としては、分散分析(ANOVA)、Tukey-Kramerのペアごとの比較、Dunnettのコントロール群との比較、平均分析(ANOM)があります。

t検定の仮定

t検定は仮定からの逸脱に対して比較的ロバスト(頑健)ですが、t検定は次のことを前提としています。

  • データ値は連続変数である。
  • 標本データは、母集団からランダムにサンプリングされている。
  • 等分散性がある(つまり、各グループのデータのばらつきは類似している)。
  • 分布は、ほぼ正規分布である。

2標本のt検定の場合、独立した標本が必要です。標本が独立していない場合は、対応のあるt検定が適切な場合があります。

t検定のタイプ

平均を比較するための3つのt検定があります。1標本のt検定、2標本のt検定、および対応のあるt検定です。次の表は、それぞれの特徴を要約し、正しい検定を選択する方法に関する指針を与えます。各タイプのt検定の仮定と計算の詳細、および例については、個々のページにアクセスしてください。

 1標本のt検定2標本のt検定対応のあるt検定
シノニムStudentのt検定
  • 独立したグループのt検定
  • 独立標本のt検定
  • 等分散の場合のt検定
  • プーリングしたt検定
  • 異分散の場合のt検定
  • 対応のあるグループのt検定
  • 関連のある標本のt検定
変数の数122
変数のタイプ
  • 連続尺度の測定値
  • 連続尺度の測定値
  • グループを定義するカテゴリカル変数または名義尺度変数
  • 連続尺度の測定値
  • グループ内でペアを定義するカテゴリカル変数または名義尺度変数
検定の目的母平均が特定の値に等しいかどうかを判断する2つの異なるグループの母平均が等しいかどうかを判断する母集団で測定値のペアの差がゼロかどうかを判断する
例:次の場合を検定しますあるグループの人々の平均心拍数が65に等しいかどうか2つのグループの人々の平均心拍数が同じかどうかグループの人々の運動前後の心拍数の平均値の差はゼロかどうか
母平均の推定標本平均各グループの標本平均測定値のペアの差の標本平均
母集団の標準偏差不明。標本標準偏差を使用不明。各グループの標本標準偏差を使用不明。測定値のペアの差の標本標準偏差を使用
自由度標本の観測数から1を引いた数、つまり:
n–1
各標本の観測値の合計から2を引いたもの、つまり:
n1 + n2 – 2
標本のペアの観測数から1を引いた数、つまり:
n–1

上記の表は、母平均のt検定のみを示しています。もう1つのよく用いられるt検定は、相関係数の検定です。このt検定を使用して、相関係数がゼロと有意に異なるかどうかを判断します。

片側検定 vs. 両側検定

仮説を定義するときは、片側検定と両側検定のどちらを使用するかも定義します。データを収集したり計算を行ったりする前に、この決定を行う必要があります。平均に対する3つのt検定すべてに対して、この決定を行います。

説明のために、1標本のt検定を使用してみましょう。プロテインバーの無作為標本があり、バー当たり20gのタンパク質を含んでいるとラベルに表示されているとします。帰無仮説は、未知の母平均が20であるというものです。データが異なる母平均を示唆しているかについて、単純に知りたいと仮定します。この場合、仮説は次のようになります。

$ \mathrm H_o: \mu = 20 $

$ \mathrm H_a: \mu \neq 20 $

これが両側検定です。データを使用して、標本平均が20と十分に異なるかどうか(大きいか小さいか)を確認して、未知の母平均が20とは異なると結論付けます。

代わりに、ラベルの広告が正しいかどうかを知りたいとします。データは、未知の母平均が20以上であるという考えを裏付けているでしょうか? それとも裏付けていないのでしょうか? この場合、仮説は次のようになります。

$ \mathrm H_o: \mu >= 20 $

$ \mathrm H_a: \mu < 20 $

これが片側検定です。データを使用して、標本平均が20より十分に小さいかどうかを確認し、未知の母平均が20以上であるという仮説を棄却します。

片側検定と両側検定の概念を示す画像については、t分布ページの「仮説検定と分布の裾」セクションを参照してください。

t検定を実行する方法

平均に関するすべてのt検定を、同じ手順で分析します。

  1. データを収集する前に、帰無仮説($ \mathrm H_o $)と対立仮説($ \mathrm H_a $)を定義します。
  2. 有意水準(α値)を決定します。これは、間違った結論を導き出すリスクをどれだけ取るかを決めることです。例えば、2つの独立したグループを比較するときにα = 0.05と設定するとします。これは、実際にはそうではない場合に、未知の母平均が互いに異なると結論付けるリスクを5%に定めたことになります。
  3. データに誤りがないか確認します。
  4. 検定の前提条件を確認します。
  5. 検定を実行し、結論を導き出します。平均に関わるすべてのt検定には、検定統計量の計算が含まれます。検定統計量をt分布の理論値と比較します。理論値には、α値とデータの自由度の両方が関係します。詳細については、1標本のt検定2標本のt検定および対応のあるt検定のページにアクセスしてください。