除了下面所述的选项之外,“提升”报表的其他所有红色小三角选项均在“分割”平台的相关文档中进行了介绍。有关这些选项的详细信息,请参见《预测和专业建模》中的分割模型。
该选项显示一个窗口,您可以在其中输入一个数字或占总样本大小的比例来定义允许的最小拆分大小。要指定一个数字,请输入大于等于 1 的值。要指定占样本大小的比例,请输入小于 1 的值。“提升”平台的默认值设置为 25 或用行数除以 2,000 后的整数部分(取两者之间较大的值)。
该表和图显示了列对于提升树的贡献。列的贡献通过计算与其拆分关联的 F 比值之和得来。回想一下我们之前介绍的,这些值用于测量回归模型中处理和拆分节点变量交互作用项的显著性。
考虑训练集中的观测数。对某一观测值带来的提升定义为针对不同的处理水平进行预测的响应概率或响应均值的差异。这些提升值按降序排序。“提升图形”在纵坐标显示提升值。该图形在横坐标显示不同提升值下观测所占的比例。
Figure 6.5 中显示了针对 Hair Care Product.jmp 样本数据表进行三次拆分后的“提升图形”示例。请注意,对于后面的两组测试对象(男性组和年龄 ≥ 42 的非淡黄色头发的女性组),促销具有负面影响。
“提升图形”中显示的水平线绘制了验证集的图形。具体来说,首先根据验证集对决策树进行评估,然后“提升图形”根据估计的提升值构造提升图形。
图 6.5 提升图形
保存差异
保存观测节点的各个处理水平上响应均值的估计差值。这是对提升的估计。
保存差异公式
保存差异或提升的公式。
发布差分公式
创建差分公式并将其另存为“公式存储库”平台中的公式列脚本。若未打开“公式存储库”报表,该选项将创建“公式存储库”报表。请参见《预测和专业建模》中的公式存储库。