t 检验
什么是 t 检验?
t 检验也称为 Student t 检验,它是一种使用假设检验来评估一个或两个总体均值的工具。t 检验可用于评估某个组是否与已知值有差异(单样本 t 检验),两个组是否彼此有差异(独立双样本 t 检验),或成对测量值中是否存在显著差异(成对或非独立样本 t 检验)。
如何使用 t 检验?
首先,定义您将要检验的假设,并指定一个可接受的、得出错误结论的风险。例如,比较两个总体时,您可能会假设它们的均值相同,并且您要确定一个可接受的得出错误结论(即不存在差异时认为存在差异)的概率。接下来,您要基于数据计算检验统计量,并将其与来自 t 分布的理论值进行比较。根据结果而定,您要么拒绝原假设,要么无法拒绝原假设。
如果有两个以上的组,该怎么办?
t 检验不适合。请使用多重比较方法。例如:方差分析 (ANOVA)、Tukey-Kramer 配对比较、与单个对照进行比较的 Dunnett's 检验以及均值分析 (ANOM)。
t 检验假设
t 检验可以相对可靠地检查与假设的偏差,它具有以下前提:
- 数据是连续型的。
- 样本数据是从总体中随机抽样的。
- 存在方差齐性(即,各组中数据的变异性相似)。
- 分布接近正态。
对于双样本 t 检验,我们必须有独立的样本。如果样本不独立,使用配对 t 检验可能比较妥当。
t 检验的类型
有 3 种用于比较均值的 t 检验:单样本 t 检验、双样本 t 检验和成对 t 检验。下表汇总了上述每一种检验的特征,并就如何选择正确的检验提供了指导意见。请访问相应的页面来了解每种类型的 t 检验,以查看示例以及关于假设和计算的详细信息。
单样本 t 检验 | 双样本 t 检验 | 成对 t 检验 | |
---|---|---|---|
同义词 | Student t 检验 |
|
|
变量数 | 1个 | 2个 | 2个 |
变量类型 |
|
|
|
检验目的 | 确定总体均值是否等于特定的值 | 确定两个不同组的总体均值是否相等 | 确定某个总体的成对测量值之间的差异是否为 0 |
示例:假设需要检验... | 一组人员的平均心率是否等于 65 | 两组人员的平均心率是否相同 | 一组人员在锻炼前和锻炼后的心率平均差异是否为 0 |
总体均值的估计值 | 样本平均值 | 每组样本平均值 | 成对测量值中的差异的样本平均值 |
总体标准差 | 未知,使用样本标准差 | 未知,使用每组样本标准差 | 未知,使用成对测量值中的差异的样本标准差 |
自由度 | 样本中的观测值数量减 1,即: n–1 | 每个样本中的观测值之和减 2,即: n1 + n2 – 2 | 样本中的成对观测值数量减 1,即: n–1 |
上表仅显示总体均值的 t 检验。另一种常用的 t 检验是关于相关系数的。此类 t 检验可以用来确定相关系数与 0 之间是否存在显著差异。
单尾检验与双尾检验
在定义假设时,您还需要明确的是采用单尾检验还是双尾检验。需要在收集数据前或执行任何计算前做出决定。还需要考虑均值的所有 3 种 t 检验。
我们将使用单样本 t 检验来加以说明。假设我们有蛋白棒的一个随机样本,蛋白棒的标签上注明每根蛋白棒含有 20 克蛋白质。原假设是未知的总体均值是 20。假设我们想知道,数据是否显示有不同的总体均值。在这种情况下,我们的假设是:
$ \mathrm H_o: \mu = 20 $
$ \mathrm H_a: \mu \neq 20 $
这里,我们使用双尾检验。我们将使用数据来查看样本均值与 20 之间是否存在显著差异(更高或更低),以得出未知的总体均值不是 20 这个结论。
现在,假设我们想知道标签上的说明是否正确。数据是否会支持未知的总体均值至少是 20 这种想法?在这种情况下,我们的假设是:
$ \mathrm H_o: \mu >= 20 $
$ \mathrm H_a: \mu < 20 $
这里,我们使用单尾检验。我们将使用数据来查看样本均值是否显著低于 20,以拒绝未知的总体均值等于或高于 20 这个假设。
请参见t 分布页面上的“假设检验的尾部”章节来查看阐述单尾检验和双尾检验概念的图片。
如何开展 t 检验
对于涉及均值的所有 t 检验,您可以在分析中执行相同的步骤:
- 在收集数据之前定义原假设 ($ \mathrm H_o $) 和备选假设 ($ \mathrm H_a $) 。
- 确定 alpha 值(或 α 值)。这涉及确定您愿意为得出错误结论而承担的风险。例如,假设您在比较两个独立的组时设置了 α=0.05。这里,您确定了有 5% 的风险会在未知的总体均值相同时得出它们之间存在差异的结论。
- 检查数据是否有误。
- 检查关于检验的假设。
- 执行检验并得出结论。关于均值的所有 t 检验都涉及到计算检验统计量。将检验统计量与来自 t 分布的理论值进行比较。理论值涉及到数据的 α 值和自由度。如需了解更多详细信息,请访问介绍单样本 t 检验、双样本 t 检验和配对 t 检验的页面。