カイ2乗検定
カイ2乗検定とは?
カイ2乗検定は、仮説検定法の一つです。2つの一般的なカイ2乗検定では、1つ以上のカテゴリで観測度数が期待度数と一致するかどうかを確認します。
カイ2乗検定はχ²検定と同じですか?
はい。χはギリシャ語における記号Chiです。
どれを選択すればいいでしょうか?
測定変数が1つの場合は、適合度のカイ2乗検定を使用します。測定変数が2つの場合、独立性のカイ2乗検定を使用します。カイ2乗検定は他にもありますが、この2つが最も一般的です。
カイ2乗検定のタイプ
データが期待どおりであるかどうかに関する仮説検定には、カイ2乗検定を使用します。検定の背後にある基本的な考え方は、データの観測値を、帰無仮説が真である時に見られるであろう期待値と比較することです。
一般的に使用される2つのカイ2乗検定があります。適合度のカイ2乗検定と独立性のカイ2乗検定です。どちらの検定にも、データをカテゴリに分類する変数が含まれます。結果として、どちらの検定を使用するかについて人々が混乱する可能性があります。次の表は、2つの検定を比較しています。
2つのタイプのカイ2乗検定のそれぞれのページにアクセスすると、前提や計算の詳細と例を確認できます。
表1:カイ2乗検定の選択
カイ2乗適合度検定 | カイ2乗独立性検定 | |
変数の数 | 1 | 2 |
検定の目的 | 1つの変数が特定の分布に由来する可能性が高いかどうかを判断する | 2つの変数が関連しているかどうかを判断する |
例 | キャンディ袋の各フレーバーの個数が同じであるかどうかを判断する | 映画ファンがスナックを購入するかどうかの決定が、鑑賞予定の映画の種類と関連しているかどうかを判断する |
例における仮説 | Ho:キャンディのフレーバーの割合は同じ Ha:フレーバーの割合は同じではない | Ho:スナックを購入する人の割合は、映画の種類に依存しない Ha:映画の種類によって、スナックを買う人の割合が異なる |
検定で使用される理論分布 | カイ2乗 | カイ2乗 |
自由度 | カテゴリ数から1を引いた値
| 1つ目の変数のカテゴリ数から1を引いた値に、2つ目の変数のカテゴリ数から1を引いた値を掛けたもの
|
カイ2乗検定の実行方法
適合度のカイ2乗検定と独立性のカイ2乗検定の両方について、以下に示す同じ分析手順を実行します。各タイプの検定のページにアクセスして、実際の手順を確認してください。
- データを収集する前に、帰無仮説と対立仮説を定義します。
- 有意水準(α)を決定します。これは、間違った結論を導き出すリスクをどれだけ引き受けるかを決めることです。例えば、独立性検定を行う際にα=0.05に設定したとします。これは、実際には独立している2つの変数を独立していないと結論づけるリスクを5%としたことになります。
- データに誤りがないか確認する。
- 検定の仮定を確認します(仮定の詳細については、それぞれの検定のタイプのページを参照してください)。
- 検定を実行し、結論を導き出します。
上の表のカイ2乗検定は、どちらも検定統計量を計算します。検定の背後にある基本的な考え方は、実測値を、帰無仮説が真である場合に期待される値と比較することです。検定統計量の計算では、実測値と期待値の2乗差を求め、それを期待値で割ります。この操作を各カテゴリごとに行い、値を加算していきます。
そして、その検定統計量をカイ2乗分布の理論値と比較します。理論値は、データの有意水準(α)と自由度の両方に依存します。詳細な例については、各検定タイプのページをご覧ください。