Student t 方法仅控制单个比较的误差率。因此,它不是真正的多重比较过程。提供的所有其他方法控制关注的所有比较的总误差率。在这些方法中,每一种方法都使用多重比较调整来计算 p 值和置信限。
“多重比较”选项的控制窗口示例显示在“最小二乘均值估计值”的启动窗口中。 本例基于 Big Class.jmp 数据表,其中将体重设置为 Y,年龄性别身高设置为模型效应。有两类估计值可用于比较:“最小二乘均值估计值”和“用户定义的估计值”。
“最小二乘均值估计值”的启动窗口
“用户定义的估计值”的启动窗口对如何指定“用户定义的估计值”进行了演示。 已选定“年龄”的三个水平和“性别”的两个水平。此外,还手动输入了“身高”的两个值。已点击“添加估计值”按钮,生成了指定水平的所有可能组合的列表。此时,您可以指定更多估计值,并通过再次点击“估计值”按钮将其添加至“估计值进行比较”列表。
“用户定义的估计值”的启动窗口
注意:在本节中,我们将用均值一词来指代最小二乘均值的估计值或用户定义的估计值。
具体而言,平均最小二乘均值是权重与矩阵 的对角线元素成反比的加权平均值。 其中,L 是用于计算组最小二乘均值的系数所构成的矩阵。有关最小二乘均值和平均最小二乘均值的技术定义,请参见 SAS/STAT 9.3 User’s Guide 中的“GLM Procedure”一节。搜索“Construction of Least Squares Means”。
Nelson:提供精确临界值和 p 值。尽可能使用,特别是在估计值不相关时。
有关技术细节的信息,请参见 SAS/STAT 9.3 User’s Guide 中的“GLM Procedure”一节。搜索“Approximate and Simulation-Based Methods”。
在“与总平均值比较”报表中添加列,提供 t 比(t 比)和 p 值(概率>|t|)。请注意,计算不平衡设计的精确临界值和 p 值要求复积分,计算起来可能较为困难。针对此类分位数的计算若失败,则计算 Sidak 分位数,但不提供 p 值。
考虑 Movies.jmp 样本数据表。您关注的是四个分级类别中是否有任何类别不寻常,这体现在其均值国内票房($) 收入与总平均收入存在差异。您需要按如下方式指定模型:将国内票房($) 指定为响应,将“类型”、分级年份指定为模型效应。
1.
选择帮助 > 样本数据库,然后打开 Movies.jmp
2.
选择分析 > 拟合模型
3.
选择国内票房($),然后点击 Y
4.
选择类型分级年份,然后点击添加
5.
点击运行
6.
从“响应国内票房($)”旁边的红色小三角菜单中,选择估计值 > 多重比较
9.
点击确定
与“分级”的总平均值比较中显示的结果指示在国内票房($) 方面分级为 PG-13 和 R 的电影的最小二乘均与总平均值存在显著差异。
与“分级”的总平均值比较
若选择“与控制组比较 - Dunnett’s”,随即打开一个窗口,要求您指定控制组。若选定“最小二乘均值估计值”,该列表将包含您选定的效应的所有水平。若选定“用户定义的估计值”,该列表将包含您指定的效应水平组合。
Dunnett:提供精确临界值和 p 值。尽可能使用,特别是在估计值不相关时。
有关技术细节的信息,请参见 SAS/STAT 9.3 User’s Guide 中的“GLM Procedure”一节。搜索“Approximate and Simulation-Based Methods”。
在“与控制组比较”报表中添加列,提供 t 比(t 比)和 p 值(概率>|t|)。请注意,计算不平衡设计的精确临界值和 p 值要求复积分,计算起来可能较为困难。针对此类分位数的计算若失败,则计算 Sidak 分位数,但不提供 p 值。
“所有配对比较”选项显示“Tukey HSD 所有配对比较”或“Student t 所有配对比较”报表(Hsu, 1996 和 Westfall et al., 2011)。构造 Tukey HSD 比较,以使显著性水平联合应用到所有配对比较。相比之下,对于 Student t 比较,显著性水平应用到每一单个比较。使用 Student t 检验执行若干配对比较时,某个比较被错误地判定存在差异的风险可能远远超出规定的显著性水平。
检验的临界值。请注意,对于 Tukey HSD,分位数为 ,其中 q 是适当的学生化范围统计量的百分点。
Tukey:提供精确临界值和 p 值。在均值不相关且具有相等方差时或设计的方差平衡时使用。
Tukey-Kramer:提供近似临界值和 p 值。在无法获取精确值时使用。
有关技术细节的信息,请参见 SAS/STAT 9.3 User’s Guide 中的“GLM Procedure”一节。搜索“Approximate and Simulation-Based Methods”。
Tukey HSD 和 Student t 比较所有水平对。对于每个配对比较,“所有配对差异”报表都显示:
该图有时称为差值图均值-均值散点图,其中显示所有均值配对差值的置信区间。(相关示例,请参见针对用户定义的比较的“所有配对比较散点图”。) 颜色指示哪些差值显著。
使用该选项可执行一个或多个等价性检验。若您想要检测有实际意义的差值,等价性检验很有用。您需要为组均值指定一个阈值差,比这更小的差值可被视为实际上等价。换言之,若两个组均值的差值未超过该数值,您愿意将其视为等价。
双单侧检验 (TOST) 方法用于检验均值之间的实际差值 (Schuirmann, 1987)。针对实际差值超过阈值的原假设,构造双单侧合并方差 t 检验。若两个检验都拒绝,则均值差值在统计上未超过任一阈值。因此,这些组被视为实际上等价。若只有一个检验拒绝或两个检验均未拒绝,则各组可能实际上不等价。
p 值下限、p 值上限 — 与 t 比的下限和上限对应的 p
最大 p 值 — p 值下限和上限的最大值
考虑 Movies.jmp 样本数据表。您关注的是 1998 年在 PG-13 和 R 这两个分级类别上动作电影和剧情电影的国内票房($) 差值。
1.
选择帮助 > 样本数据库,然后打开 Movies.jmp
2.
选择分析 > 拟合模型
3.
选择国内票房($),然后点击 Y
4.
选择类型分级年份,然后点击添加
5.
点击运行
6.
从“响应国内票房($)”旁边的红色小三角菜单中,选择估计值 > 多重比较
7.
10.
在标题为年份的列表中,输入 1998 年。
11.
点击添加估计值。请注意,您指定的水平的所有可能组合现在都显示在添加估计值按钮的下方。
12.
在“选择初始比较”列表中,选择所有配对比较 - Tukey HSD
已填充的“用户定义的估计值”窗口
13.
点击确定
“所有配对差异”报表指示六个配对比较中有三个是显著的。针对用户定义的比较的“所有配对比较散点图”中显示的“所有配对比较散点图”将这些比较的置信区间显示为红色。同时还为其中一个区间显示了工具提示,指示该区间比较“Action,分级 R”电影与“Drama,分级 PG-13”电影,而且国内票房($) 的均值差值为 -53.58。
针对用户定义的比较的“所有配对比较散点图”
16.
点击确定
执行 TOST 检验以确定哪些电影类别是等价的,假设您认为以国内票房($) 为单位差值小于 50 的类别视为等价。“等价性检验散点图”(等价性检验散点图)指示两对电影类别可被视为等价。
等价性检验散点图