•
|
•
|
•
|
•
|
•
|
•
|
•
|
通过惩罚回归系数的绝对值加权之和来计算参数估计值。l1 罚值权重由数据决定以保证 Oracle 性质 (Zou, 2006)。该选项使用 MLE 来衡量 l1 惩罚的权重。若预测变量数超过观测数或者预测变量之间存在严格的线性依赖关系,则无法计算 MLE。若无法计算回归参数的 MLE,则将广义逆矩阵解或岭解用于 l1 罚值权重。请参见自适应方法。
若预测变量高度相关,Lasso 和自适应 Lasso 选项通常选择更简化的模型。这些方法倾向于在一组相关的预测变量中只选择一个变量。高维数据倾向于具有高度相关的预测变量。对于这类数据,选择弹性网络可能比选择 Lasso 更好。详细信息,请参见Lasso 回归。
使用自适应 l1 罚值以及 l2 罚值来计算参数估计值。该选项使用 MLE 来衡量 l1 惩罚的权重。若预测变量数超过观测数或者预测变量之间存在严格的线性依赖关系,则无法计算 MLE。若无法计算回归参数的 MLE,则将广义逆矩阵解或岭解用于 l1 罚值权重。您可以在“高级控件”面板中设置“弹性网络 Alpha”的值。请参见自适应方法。
当预测变量高度相关时,与 Lasso 相比,弹性网络能提供更好的预测准确性。(实际上,岭和 Lasso 是弹性网络的特例。) 从预测能力来看,自适应弹性网络的性能通常要比弹性网络和自适应 Lasso 的性能高。弹性网络可以选择有相关性的预测变量组并为涉及的预测变量分配合适的参数估计值。详细信息,请参见弹性网络。
在两个阶段中计算参数估计值。在第一阶段中,拟合 Lasso 模型以确定要用在第二阶段中的项。在第二阶段中,使用第一阶段中的项拟合自适应 Lasso 模型。第二阶段仅考虑包含在第一阶段模型中的项。显示的结果针对第二阶段拟合。若在第一阶段中没有任何变量进入模型,则不会出现第二阶段,报表中将显示第一阶段的结果。请参见自适应方法。
Lasso 和岭估计方法的解路径取决于一个调节参数。弹性网络的解路径取决于针对似然罚值以及弹性网络 Alpha 的调节参数。弹性网络的似然罚值是与 Lasso 和岭估计方法关联的罚值的加权求和。“弹性网络 Alpha”决定这两个罚值的权重。请参见估计方法的统计详细信息和高级控件的统计详细信息。
要求低阶效应在相关的高阶效应前进入模型。在多数情况下,这意味着 X2 不在模型中,除非 X 在模型中。对于“向前选择”之外的估计方法,有可能 X2 进入模型而在同一步中 X 离开模型。若数据表包含实验设计脚本,则启用该选项,但是默认情况下它是关闭的。
设置弹性网络的 α 参数。该 α 参数确定用于估计弹性网络系数的 l1 和 l2 罚值调节参数的组合值。默认值为 α = 0.9 ,它设置 l1 罚值的系数为 0.9,设置 l2 罚值的系数为 0.1。仅当选择“弹性网络”作为“估计方法”时,该选项才可用。请参见估计方法的统计详细信息。
提供选项,用于选择双 Lasso 和两阶段向前选择的第一阶段中的解。默认情况下,根据指定的验证方法被视为最佳拟合的解将被选定,并且是最初显示的解(最佳拟合)。您可以选择最初显示一些模型,这些模型位于绿色或黄色区域中具有更大或更小 l1 范数值。例如,若您选择“黄色区域中最小”,最初显示的解将是黄色区域中具有最小 l1 范数的模型。请参见可比模型区域。
提供的选项用于选择解,该解最初显示为“解路径”报表中的当前模型。当前模型通过一条垂直实线来标识。请参见当前模型指示符。最佳拟合解通过垂直虚线来标识。默认情况下,显示的解是根据指定的验证方法被视为最佳拟合的解。
‒
|
‒
|
‒
|
计算 k 重的验证对数似然的均值。该值充当调节参数值的验证对数似然。
|
具有最大验证对数似然的调节参数的值用于构造最终解。要获取最终模型,将对整个数据集拟合从调节参数最优值得到的全部 k 个模型。在这些模型中,具有最高的验证对数似然的模型将被选为最终模型。用于该最终模型的训练集将被指定为训练集,并且该模型的“维持”重是验证集。这些就是在最终解的图中和报表结果中使用的训练集和验证集。
使解路径上的扩展正则信息准则 (ERIC) 最小化。请参见模型拟合详细信息。仅可用于指数系列分布以及 Lasso 和自适应 Lasso 估计方法。
点击执行时,将打开一个报表。报表的标题指定您选择的拟合和验证方法。您可以返回“模型启动”控制面板来执行更多分析和选择其他估计和验证方法。