t 检验

什么是 t 检验?

t 检验也称为 Student t 检验,它是一种使用假设检验来评估一个或两个总体均值的工具。t 检验可用于评估某个组是否与已知值有差异(单样本 t 检验),两个组是否彼此有差异(独立双样本 t 检验),或成对测量值中是否存在显著差异(成对或非独立样本 t 检验)。

如何使用 t 检验?

首先,定义您将要检验的假设,并指定一个可接受的、得出错误结论的风险。例如,比较两个总体时,您可能会假设它们的均值相同,并且您要确定一个可接受的得出错误结论(即不存在差异时认为存在差异)的概率。接下来,您要基于数据计算检验统计量,并将其与来自 t 分布的理论值进行比较。根据结果而定,您要么拒绝原假设,要么无法拒绝原假设。

如果有两个以上的组,该怎么办?

t 检验不适合。请使用多重比较方法。例如:方差分析 (ANOVA)、Tukey-Kramer 配对比较、与单个对照进行比较的 Dunnett's 检验以及均值分析 (ANOM)。

t 检验假设

t 检验可以相对可靠地检查与假设的偏差,它具有以下前提:

  • 数据是连续型的。
  • 样本数据是从总体中随机抽样的。
  • 存在方差齐性(即,各组中数据的变异性相似)。
  • 分布接近正态。

对于双样本 t 检验,我们必须有独立的样本。如果样本不独立,使用配对 t 检验可能比较妥当。

t 检验的类型

有 3 种用于比较均值的 t 检验:单样本 t 检验、双样本 t 检验和成对 t 检验。下表汇总了上述每一种检验的特征,并就如何选择正确的检验提供了指导意见。请访问相应的页面来了解每种类型的 t 检验,以查看示例以及关于假设和计算的详细信息。

 单样本 t 检验双样本 t 检验成对 t 检验
同义词Student t 检验
  • 独立组 t 检验
  • 独立样本 t 检验
  • 等方差 t 检验
  • 合并 t 检验
  • 不等方差 t 检验
  • 成组 t 检验
  • 非独立样本 t 检验
变量数1个2个2个
变量类型
  • 连续型测量值
  • 连续型测量值
  • 分类型或名义型,用于定义组
  • 连续型测量值
  • 分类型或名义型,用于定义组内的配对
检验目的确定总体均值是否等于特定的值确定两个不同组的总体均值是否相等确定某个总体的成对测量值之间的差异是否为 0
示例:假设需要检验...一组人员的平均心率是否等于 65两组人员的平均心率是否相同一组人员在锻炼前和锻炼后的心率平均差异是否为 0
总体均值的估计值样本平均值每组样本平均值成对测量值中的差异的样本平均值
总体标准差未知,使用样本标准差未知,使用每组样本标准差未知,使用成对测量值中的差异的样本标准差
自由度样本中的观测值数量减 1,即:
n–1
每个样本中的观测值之和减 2,即:
n1 + n2 – 2
样本中的成对观测值数量减 1,即:
n–1

上表仅显示总体均值的 t 检验。另一种常用的 t 检验是关于相关系数的。此类 t 检验可以用来确定相关系数与 0 之间是否存在显著差异。

单尾检验与双尾检验

在定义假设时,您还需要明确的是采用单尾检验还是双尾检验。需要在收集数据前或执行任何计算前做出决定。还需要考虑均值的所有 3 种 t 检验。

我们将使用单样本 t 检验来加以说明。假设我们有蛋白棒的一个随机样本,蛋白棒的标签上注明每根蛋白棒含有 20 克蛋白质。原假设是未知的总体均值是 20。假设我们想知道,数据是否显示有不同的总体均值。在这种情况下,我们的假设是:

$ \mathrm H_o: \mu = 20 $

$ \mathrm H_a: \mu \neq 20 $

这里,我们使用双尾检验。我们将使用数据来查看样本均值与 20 之间是否存在显著差异(更高或更低),以得出未知的总体均值不是 20 这个结论。

现在,假设我们想知道标签上的说明是否正确。数据是否会支持未知的总体均值至少是 20 这种想法?在这种情况下,我们的假设是:

$ \mathrm H_o: \mu >= 20 $

$ \mathrm H_a: \mu < 20 $

这里,我们使用单尾检验。我们将使用数据来查看样本均值是否显著低于 20,以拒绝未知的总体均值等于或高于 20 这个假设。

请参见t 分布页面上的“假设检验的尾部”章节来查看阐述单尾检验和双尾检验概念的图片。

如何开展 t 检验

对于涉及均值的所有 t 检验,您可以在分析中执行相同的步骤:

  1. 在收集数据之前定义原假设 ($ \mathrm H_o $) 和备选假设 ($ \mathrm H_a $) 。
  2. 确定 alpha 值(或 α 值)。这涉及确定您愿意为得出错误结论而承担的风险。例如,假设您在比较两个独立的组时设置了 α=0.05。这里,您确定了有 5% 的风险会在未知的总体均值相同时得出它们之间存在差异的结论。
  3. 检查数据是否有误。
  4. 检查关于检验的假设。
  5. 执行检验并得出结论。关于均值的所有 t 检验都涉及到计算检验统计量。将检验统计量与来自 t 分布的理论值进行比较。理论值涉及到数据的 α 值和自由度。如需了解更多详细信息,请访问介绍单样本 t 检验双样本 t 检验配对 t 检验的页面