在该示例中,您使用“分割”平台构造一个决策树,用于预测糖尿病患者的一年疾病发展情况(“低”或“高”)。
1. 选择帮助 > 样本数据库和 Diabetes.jmp。
2. 选择分析 > 预测建模 > 分割。
3. 选择 Y 二值型并点击 Y,响应。
4. 从年龄一直选到葡萄糖,然后点击 X,因子。
5. 为验证部分输入 0.33。
注意:在 JMP Pro 中,可以使用一个验证列进行验证。选择验证并点击验证。将验证部分设置为 0。
6. 点击确定。
7. 在平台报表窗口中,点击执行以执行自动拆分。
注意:由于“验证部分”会随机抽取,您的结果有可能不同于Figure 4.2 中的结果。
图 4.2 糖尿病的分割报表
自动拆分得到四个拆分。验证集的最终 R 方为 0.154。决策树显示四个拆分以及每个拆分中的观测计数。
8. 点击“‘Y 二值型’分割”旁边的红色小三角菜单,然后选择列贡献。
图 4.3 “列贡献”报表
“列贡献”报表显示 LTG 和 BMI 是决策树模型中仅有的两个预测变量。在两个拆分中使用每个列。您的结果可能不同。使用“验证部分”时,从数据表中随机选择验证集。若您重做分析,将选择新的随机验证集,并且您的结果可能不同于第一次分析的结果。
9. 点击“‘Y 二值型’分割”旁边的红色小三角,然后选择保存列 > 刻画器。
图 4.4 分割模型的刻画器
该刻画器支持您更改 BMI 和 LTG 的值以获取预测的 Y 二值型结果。其他任何因子在分割模型中都没有拆分。它们的特征是平直线条。
10. 点击“‘Y 二值型’分割”旁边的红色小三角菜单,然后选择保存列 > 保存预测公式。
在 Diabetes.jmp 数据表中,添加名为 Prob(Y 二值型==Low)、Prob(Y 二值型==High) 和最可能的“Y 二值型”的列。要查看如何计算这些响应概率,在“列”面板中,在每列旁边双击“公式”图标 。