卡方检验

什么是卡方检验?

卡方检验是一种假设检验方法。两种常用的卡方检验都将检查在一或多个类别中观测到的频率与期望的频率是否相符。

卡方检验与 χ² 检验是否相同?

是的,χ 就是希腊字母 Chi。

如何选择适合的卡方检验?

如果您有一个测量变量,应该使用拟合优度卡方检验。如果您有两个测量变量,应该使用独立性卡方检验。还有其他卡方检验,但这两种是最常用的。

卡方检验的类型

您使用卡方检验来验证关于数据是否符合期望的假设。这种检验背后的基本思路是,将数据中的观测值与原假设为真时的期望值进行比较。

有两种常用的卡方检验:拟合优度卡方检验独立性卡方检验。这两种检验都涉及到将数据分成不同类别的变量。因此,人们可能会感到困惑,不知该使用哪种检验。下表对这两种检验进行了比较。

访问相应的页面来了解每种类型的卡方检验,并查看示例以及关于假设和计算的详细信息。

表 1:选择卡方检验

 

拟合优度卡方检验

独立性卡方检验

变量数ONE2 个
检验目的确定一个变量是否可能来自某个给定的分布确定两个变量是否可能相关
示例确定糖果包中每种口味糖果数量是否相同确定电影观众决定购买零食是否与他们打算观看的电影类型相关
示例中的假设

Ho:不同口味糖果的比例相同

Ha:不同口味糖果的比例不同

Ho:购买零食的观众比例与电影类型无关

Ha:购买零食的观众比例与电影类型相关

检验中使用的理论分布卡方卡方
自由度

类别数减 1

  • 在我们的示例中,就是糖果的口味数减 1

第一个变量的类别数减 1,乘以第二个变量的类别数减 1

  • 在我们的示例中,就是电影类别数减 1,乘以 1(因为购买零食是“是”/“否”变量,且 2-1 = 1)

 

如何开展卡方检验?

对于拟合优度卡方检验独立性卡方检验,您需要执行下列相同的分析步骤。请访问每种检验类型的页面,查看详细操作步骤。

  1. 在收集数据之前定义原假设和备择假设。
  2. 确定 alpha 值。这涉及到您愿意为得出错误结论而承担的风险。例如,假设您在检验独立性时设置 α=0.05。这里,您确定了有 5% 的风险会得出错误的结论,即,两个变量实际上是不独立的,但检验得出的结论是独立的。
  3. 检查数据是否有误。
  4. 检查关于检验的假设。(请访问每种检验类型的页面,了解关于假设的更多详情。)
  5. 执行检验并得出结论。


上表中的两种卡方检验都涉及到计算检验统计量。这些检验背后的基本思路是:将实际数值与原假设为真时将会出现的期望值进行比较。检验统计量包括找到实际数据值与期望数据值之间的平方差,然后用这个差值除以期望的数据值。对每个数据点执行此操作并将这些值相加。

然后,将检验统计量与来自卡方分布的理论值进行比较。理论值取决于数据的 alpha 值和自由度。请访问每种检验类型的页面来查看详细示例。