在本例中,假定您要使用 116 辆汽车的车重来预测汽车尺寸(车型)。汽车尺寸可以为以下值之一(按最小到最大的顺序排列):赛车、小型车、紧凑型车、中型车或大型车。
1. 选择帮助 > 样本数据库,然后打开 Car Physical Data.jmp。
2. 在列面板中,右击车型左侧的图标并选择有序型。
3. 右击车型并选择列信息。
4. 从“列属性”菜单中选择值顺序。
5. 验证数据是按以下从上到下的顺序排列:赛车、小型车、紧凑型车、中型车、大型车。
6. 点击确定。
7. 选择分析 > 以 X 拟合 Y。
8. 选择车型并点击 Y,响应。
9. 选择 Weight 并点击 X,因子。
10. 点击确定。
随即显示报表窗口。
图 8.6 “车重-车型”Logistic 图的示例
请注意以下事项:
• 第一条(底部)曲线表示给定车重下汽车是赛车的概率。
• 第二条曲线表示汽车是小型车或赛车的概率。仅查看第一条和第二条曲线之间的距离,它对应汽车是小型车的概率。
• 正如您期望的那样,越重的车越有可能是大型车。
• 根据数据的 x 坐标绘制数据标记。y 位置在对应于该行的响应类别范围内随机散布。
若 x 变量对响应没有影响,则拟合的线是水平的且连续因子范围内每个响应的概率为常数。图 8.7 显示一个 Logistic 图,在该图中车重对于预测车型没有帮助。
图 8.7 显示无 x-y 关系的样本数据表和 Logistic 图的示例
注意:要重新创建图 8.7 和图 8.8 中的图,您必须首先创建此处所示的数据表,然后执行本节开头的步骤 7-10。
若响应完全由因子值来预测,则 Logistic 曲线实际上是垂直的。响应的预测值在每个因子水平上接近确定(概率几乎为 1)。图 8.8 显示一个 Logistic 图,在该图中车重几乎可以完全预测车型。
图 8.8 显示几乎完全 x-y 关系的样本数据表和 Logistic 图的示例
在这种情况下,参数估计值变得很大并在回归报表中被标记为不稳定。在这些情况下,您可以考虑使用带 Firth 偏倚调整估计值的“广义线性模型”特质。请参见《拟合线性模型》中的启动“广义线性模型”特质。