在该示例中,您使用“分割”平台构造一个决策树,用于预测糖尿病患者的一年疾病发展情况(用定量等级表示)。
1. 选择帮助 > 样本数据库和 Diabetes.jmp。
2. 选择分析 > 预测建模 > 分割。
3. 选择 Y 并点击 Y,响应。
4. 从年龄一直选到葡萄糖,然后点击 X,因子。
5. 基于您的 JMP 安装选择一个验证过程:
‒ 对于 JMP Pro,选择验证并点击验证。
‒ 对于 JMP,输入 0.3 作为验证部分。
注意:因为验证行是随机选择的,使用验证比例的结果可能不同于此处所示的结果。
验证部分 = 0.3 的已完成启动窗口
6. 点击确定。
7. 在平台报表窗口中,点击一次拆分以执行一次拆分。
第一次拆分后的报表(隐藏了决策树)
训练数据集中的原始 309 个值现在拆分为两部分:
‒ 左叶(对应于 LTG < 4.6444)有 165 个观测。
‒ 右叶(对应于 LTG >= 4.6444)有 144 个观测。
对于左叶和右叶,下次拆分将针对 BMI。右叶上 BMI 的候选项 SS 高于左叶上 BMI 的候选项 SS。因此,下一次拆分在右叶上进行。
8. 点击执行以使用自动拆分。
带验证、自动拆分后的报表
解找到四次拆分。“拆分历史记录”图显示在四次拆分后,验证数据集没有进一步改进。验证数据上的 R 方值 0.39 不支持该模型作为疾病发展的强预测变量。分割图中各部分的散布进一步指示该模型不能很好地分离 Y 水平。