当您使用统计模型在给出响应变量的值的情况下推断解释变量的值时,就会出现逆预测。逆预测有时称为校准。
通过在“估计值”菜单上选择“逆预测”,您可以估计与响应的指定值对应的自变量 X 的值(图 3.37)。此外,您可以指定模型中其他解释变量的值(图 3.37)。逆预测计算为与指定的响应值对应的 X 的值提供置信限。您可以将响应值指定为响应均值,或只是单个响应。相关示例,请参见“逆预测”示例。
当模型包括多个解释变量时,您可以针对其他变量的指定值预测 X 的值。您可能希望预测当一个人的休息时脉搏为 60 时,吸氧量为 50 所需的跑步时间。您可能希望针对男性和女性分别进行逆预测。使用逆预测选项指定这些要求。
在逆预测窗口中,解释变量列表显示在左侧。(相关示例,请参见图 3.37。)每个连续变量最初都设置为其均值。每个名义型或有序型变量都设置为其最低水平(按照值排序)。您必须删除想要预测的变量的值,将其设置为缺失。此外,您还必须指定逆预测中希望固定的其他变量的值(若这些变量值与默认设置值不同)。在窗口右侧的列表中,您可以提供一个或多个关注的响应值。有关示例,请参见在有多个模型效应的情况下预测单个 X 值的示例。
注意:逆预测的置信限有时可生成单侧甚至是无穷区间。有关技术细节的信息,请参见带置信限的逆预测。
在本例中,您拟合的回归模型用于根据跑步时间预测吸氧量。然后您要估计导致指定的吸氧量值的跑步时间值。只有一个 X(即跑步时间),所以您可以先使用“以 X 拟合 Y”平台获取逆预测值的直观近似值。
1. 选择帮助 > 样本数据库,然后打开 Fitness.jmp。
2. 选择分析 > 以 X 拟合 Y。
3. 选择吸氧量并点击 Y,响应。
4. 选择跑步时间并点击 X,因子。
5. 点击确定。
6. 点击“二元拟合,以‘跑步时间’拟合‘吸氧量’”红色小三角并选择拟合线。
使用如下所述的十字准线工具近似计算导致吸氧量的均值为 50 的跑步时间值。
7. 选择工具 > 十字准线。
8. 点击预测线,然后拖动十字准线工具以查找吸氧量 = 50 的逆预测。
图 3.34 显示跑步时间约为 9.77,它给出吸氧量约为 50 的逆预测。
图 3.34 Fitness.jmp 的“二元拟合”
要获取跑步时间的精确预测以及置信区间,请使用“拟合模型”启动窗口:
1. 从 Fitness.jmp 样本数据表中,选择分析 > 拟合模型。
2. 选择吸氧量并点击 Y。
3. 选择跑步时间,然后点击添加。
4. 点击运行。
5. 点击“响应‘吸氧量’”红色小三角并选择估计值 > 逆预测。
6. 按图 3.35 所示为吸氧量输入四个值。
7. 点击确定。
图 3.35 完成的“逆预测规格”窗口
“逆预测”报表提供了与每个指定的吸氧量值对应的跑步时间预测值。该报表还显示了相对于获取响应均值,这些跑步时间值的 95% 置信下限和置信上限。
图 3.36 “逆预测”报表
导致吸氧量值为 50 的跑步时间精确预测值为 9.7935。该值接近图 3.34 所示的“二元拟合”报表中显示的跑步时间近似值 9.77。“逆预测”报表还提供了一个图,其中显示吸氧量与跑步时间之间的线性关系以及置信区间。
本例预测休息时脉搏为 60 时导致吸氧量为 50 的跑步时间。分别针对男性和女性预测跑步时间。
1. 从 Fitness.jmp 样本数据表中,选择分析 > 拟合模型。
2. 选择吸氧量并点击 Y。
3. 选择性别、跑步时间和休息时脉搏,然后选择添加。
4. 点击运行。
5. 点击“响应‘吸氧量’”红色小三角并选择估计值 > 逆预测。
6. 删除跑步时间的值,因为您想要预测该值。
7. 选择性别旁边的全部框,为性别的所有水平估计跑步时间。
8. 用 60 替换休息时脉搏的均值。
9. 为吸氧量输入值 50,如图 3.37 所示。
10. 点击确定。
图 3.37 多重回归模型的逆预测规格
图 3.38 所示的报表为男性和女性提供了跑步时间的预测值。其中还包含响应均值为 50 的情况下跑步时间值的 95% 置信区间。
图 3.38 多重回归模型的“逆预测”报表
该图显示休息时脉搏为 60 时针对女性和男性的线性拟合。两个置信区间分别显示为红色和蓝色。