在本例中,您构造一个提升树模型以预测哪些打印作业受到名为纹印的缺陷的影响。
1. 选择帮助 > 样本数据,然后打开 Bands Data.jmp。
2. 选择分析 > 预测建模 > 提升树。
3. 选择纹印?并点击 Y,响应。
4. 选择 Predictors 列组并点击 X,因子。
5. 为验证部分输入 0.2。
6. 点击确定。
随即显示“提升树规格”窗口。
7. (可选)在“再现性”面板中,选择禁止多线程并为“随机种子”输入 123。
由于提升树拟合涉及随机成分,这些操作可确保您获取如下所示的精确结果。
8. 点击确定。
图 6.2 名义型响应的总体统计量
由于响应纹印?是分类响应,提升树分析在“测度”下提供“误分类率”并提供一个“混淆矩阵”报表。验证集的误分类率为 0.1852,或约为 19%。
9. 点击“‘纹印?’的提升树”旁边的红色小三角,然后选择显示树状结构 > 显示名称类别估计值。
“树视图”报表随即显示,并且为各层都显示概要图。您可以检查各层以查看拟合的树和预测值。
图 6.3 提升树的第 1 层
10. 点击“‘纹印?’的提升树”旁边的红色小三角,然后选择保存列 > 保存预测公式。
名为 Prob(纹印?==noband)、Prob(纹印?==band) 和最可能的纹印?的列添加到数据表中。检查 Prob(纹印?==noband) 列以查看如何从各层计算模型预测。