样本数据表 Diabetes.jmp 用于为连续响应 Y 创建一个报表。
图 4.9 连续响应的分割报表
初始化分割图,不进行任何分割。每个点表示数据表中的一个观测。若使用了验证,该图仅用于训练数据。
请注意以下情况:
• 垂直轴表示观测的响应值。
• 水平线显示决策树的每个节点的响应均值。初始水平线位于响应的总体均值。
• 垂直轴划分表示决策树中的拆分。最近拆分的文本说明显示在水平轴下。将观测重新组织为创建或删除拆分时的相应节点。
提示:要查看狭窄分割的工具提示,请将您的光标放置在分割图的水平轴的标签上。
图 4.10 连续响应的汇总报表
“汇总报表”提供训练数据、验证数据和测试数据(若使用)的拟合统计量。“汇总面板”中的拟合统计量随着您添加拆分或剪除决策树而更新。
R 方
R2 的当前值。
RMSE
均方根误差。
数目
观测数。
拆分数
决策树中的当前拆分数。
AICc
校正的 Akaike 信息准则。请参见《拟合线性模型》中的似然、AICc 和 BIC。
树中的每个节点都有一个报表和一个包含附加选项的红色小三角菜单。末端节点也有“候选项”报表。
图 4.11 连续响应的末端节点报表
计数
分支中的观测(行)数。
均值
该分支中所有观测的平均响应。
标准差
该分支中所有观测的响应的标准差。
候选项
对于每列,“候选项”报表都提供有关该列的最优拆分的详细信息。用星号标记所有列上的最优拆分。
项
显示候选项列。
候选项平方和
最佳拆分的平方和。
LogWorth
LogWorth 统计量,定义为 -log10(p 值)。最优拆分是使 LogWorth 得到最大值的拆分。请参见“分割”平台的统计详细信息。
截断点
确定拆分的预测变量的值。对于分类项,列出最左侧拆分中的水平。
最佳拆分通过一个星号来标注。不过在有些情况下,“候选项平方和”最大值与“Logworth”最大值对应的不是同一个变量。在这种情况下,使用 > 和 < 为每个变量指出最佳方向。星号对应于两者一致的状况。请参见“分割”平台的统计详细信息。