“分割”平台根据预测变量和响应值之间的关系将数据递归分割,从而创建决策树。分割的发展变化很快,基本涵盖了以下几种算法:决策树、CARTTM、CHAIDTM、C4.5、C5 等等。因为以下原因,该方法通常被视为一种数据挖掘方法:
•
|
预测变量可以是连续或分类变量(名义型或有序型)。若预测变量是连续变量,则按切割值创建拆分。样本根据其值是低于还是高于该切割值进行划分。若预测变量是分类变量,则将样本分为两个水平组。