•
|
•
|
“剪除向前选择”是“逐步回归”特质中的“混合步骤”选项的替换选项。不过,它不使用 p 值来确定哪些变量进入或离开模型。
通过在每一步中增加活跃效应数计算参数估计值。在每一步中,从所有可能的模型(具有由步骤号指定的一些效应)中选择所需模型。“解路径”图的水平轴上的值表示模型中活跃效应的数目。步骤 0 对应于仅含截距的模型。步骤 1 对应于仅包含一个活跃效应的模型中的最佳模型。步骤会继续增加,直到达到在“模型启动”报表的“高级控件”中指定的“最大效应数”的值。请参见高级控件。
(仅当指定的分布为“正态”且未选定“无截距”选项时才可用。)通过使用线性规划法应用 l1 罚值来计算参数估计值。请参见 Candes and Tao (2007)。Dantzig 选择器适用于分析设计实验的结果。对于正交问题,Dantzig 选择器和 Lasso 提供相同结果。详细信息,请参见Dantzig 选择器。
通过惩罚回归系数的绝对值加权之和来计算参数估计值。l1 罚值权重由数据决定以保证 Oracle 性质 (Zou, 2006)。该选项使用 MLE 来衡量 l1 惩罚的权重。若预测变量数超过观测数或者预测变量之间存在严格的线性依赖关系,则无法计算 MLE。若无法计算回归参数的 MLE,则将广义逆矩阵解或岭解用于 l1 罚值权重。请参见自适应方法。
若预测变量高度相关,Lasso 和自适应 Lasso 选项通常选择更简化的模型。这些方法倾向于在一组相关的预测变量中只选择一个变量。高维数据倾向于具有高度相关的预测变量。对于这类数据,选择弹性网络可能比选择 Lasso 更好。详细信息,请参见Lasso 回归。
使用自适应 l1 罚值以及 l2 罚值来计算参数估计值。该选项使用 MLE 来衡量 l1 罚值的权重。若预测变量数超过观测数或者预测变量之间存在严格的线性依赖关系,则无法计算 MLE。若无法计算回归参数的 MLE,则将广义逆矩阵解或岭解用于 l1 罚值权重。您可以在“高级控件”面板中设置“弹性网络 Alpha”的值。请参见自适应方法。
当预测变量高度相关时,与 Lasso 相比,弹性网络能提供更好的预测准确性。(实际上,岭和 Lasso 是弹性网络的特例。)从预测能力来看,自适应弹性网络的性能通常要比弹性网络和自适应 Lasso 的性能高。弹性网络可以选择有相关性的预测变量组并为涉及的预测变量分配合适的参数估计值。详细信息,请参见弹性网络。
双 Lasso 在观测数小于预测变量数时尤其有用。通过将变量选择和收缩运算细分为两个阶段,第二阶段中的 Lasso 就不太可能过度惩罚应包含在模型中的项。双 Lasso 类似于松弛 Lasso,后者在 Hastie et al. (2009, p. 91) 中说明。
在两个阶段中计算参数估计值。在第一阶段中,拟合自适应 Lasso 模型以确定要用在第二阶段中的项。在第二阶段中,使用第一阶段中的项拟合自适应 Lasso 模型。第二阶段仅考虑包含在第一阶段模型中的项,并使用基于第一阶段中的参数估计值的权重。您可以使用“高级控件”中的“自适应惩罚权重”选项选择计算权重的方法。请参见“高级控件”选项。显示的结果针对第二阶段拟合。若在第一阶段中没有任何变量进入模型,则不会出现第二阶段,报表中将显示第一阶段的结果。请参见自适应方法。