通过选择分析 > 预测建模 > 提升树启动“提升树”平台。
图 6.6 使用 Body Fat.jmp 的“提升树”启动窗口
有关“选择列”红色小三角菜单中选项的详细信息,请参见《使用 JMP》中的“列过滤器”菜单。
“提升树”平台启动窗口提供以下选项:
Y,响应
您想要分析的一个或多个响应变量。
X,因子
预测变量。
权重
一列,该列的数值为分析中的每一行都分配一个权重。
频数
一列,该列的数值为分析中的每一行都分配一个频数。
验证
用于定义验证集的数值列。该列应包含至多三个非重复值。
‒ 若验证列有两个水平,则较小的值定义训练集,较大的值定义验证集。
‒ 若验证列包含三个水平,将按值由小到大的顺序相应定义训练集、验证集和测试集。
‒ 若验证列有三个以上的水平,则包含最小三个值的行定义验证集。其他所有行都从分析中排除。
“提升树”平台使用验证列来训练和调优模型,或者训练、调优和评估模型。有关验证的详细信息,请参见JMP 建模中的验证。
若在“选择列”列表中没有选择任何列的情况下点击“验证”按钮,您可以向数据表添加一个验证列。有关“生成验证列”实用工具的详细信息,请参见生成验证列。
依据
一个或多个列,其水平定义不同的分析。对于指定列的每个水平,都使用您已经指定的其他变量分析相应行。结果显示在不同的报表中。若指定了多个“依据”变量,将为“依据”变量水平的每种可能组合生成单独的报表。
方法
支持您选择分割方法(决策树、Bootstrap 森林法、提升树、K 最近邻或朴素 Bayes)。这些备选方法(决策树除外)均在 JMP Pro 中提供。
有关这些方法的详细信息,请参见分割模型、Bootstrap 森林法、K 最近邻和朴素 Bayes。
验证部分
要用作验证集的数据部分。
信息性缺失
若选定,则对于分类预测变量,将其缺失值单独作为一类;对于连续预测变量,则对其缺失值采取信息性处理。请参见信息性缺失。
有序型限制顺序
若选定,对于有序变量,在拆分时则会进行限定以维持有序变量水平的排序。