包含连续回归量项的方差分析模型称为协方差分析。在 Drug.jmp 样本数据表中,列 x 是一个协变量。
协变量向模型方程添加了附加项 x3i。协方差模型的模型分析表示为:
有两个模型效应:一个是涉及两个参数的名义型主效应,另一个是与一个参数关联的连续协变量。
1. 选择帮助 > 样本数据库,然后打开 Drug.jmp。
2. 选择分析 > 拟合模型。
3. 选择 y 并点击 Y。
4. 选择药物和 x,然后点击添加。
5. 点击运行。
报表中的“回归图”显示您拟合了一个斜率相等的模型(图 4.4)。与主效应模型(仅含药物效应)相比,R 方从 22.8% 增长至 67.6%。均方根误差从 6.07 降至 4.0。如图 4.4 所示,整体模型的 F 检验显著性概率从 0.03 降至不足 0.0001。
图 4.4 药物数据的协方差分析
药物数据表包含重复的观测。例如,第 1 行和第 9 行都包含药物 = a 且 x = 11。在拟合模型时,重复的观测可用于构造变异的纯误差估计值。可以为未指定函数形式的协变量或名义型效应的交互作用构造另一种误差估计值。这些估计值构成失拟检验的基础。若失拟误差显著,这指示模型未能解释数据中的某个效应。
“失拟”报表显示针对药物数据的这一检验的结果。失拟误差不显著,“概率>F”值 0.7507 证实了这一点。
协变量 x 解释了之前由药物变量所解释的响应中的多数变异。因此,尽管该模型的拟合误差少得多,但药物效应不再显著。在主效应模型中观测到的药物的显著性看起来由协变量解释。
协方差模型中的最小二乘均值不同于普通均值。这是因为这些均值已针对协变量 x 的效应在响应 y 上进行了调整。最小二乘均值是当协变量 x 具有某个中性值时,为药物三个水平中的每个水平预测的值。中性值被选作协变量的均值,即 10.7333。
使用“参数估计值”报表中给出的参数估计值计算最小二乘均值:
预测表达式:
-2.696 - 1.185*药物[a] - 1.0761*药物[d] + 0.98718*x
对于 a:
-2.696 - 1.185*(1) -1.0761*(0) + 0.98718*(10.7333) = 6.71
对于 d:
-2.696 - 1.185*(0) -1.0761*(1) + 0.98718*(10.7333) = 6.82
对于 f:
-2.696 - 1.185*(-1) -1.0761*(-1) + 0.98718*(10.7333) = 10.16
图 4.5 显示每个效应的杠杆图。由于协变量显著,药物的杠杆率值距离其最小二乘均值有些分散。
图 4.5 比较药物检验数据的杠杆图