使用“高级控件”选项可以调整模型拟合过程的各个方面。很多控件与调节参数的网格有关。
Lasso 和岭估计方法的解路径取决于一个调节参数。弹性网络的解路径取决于针对似然罚值以及弹性网络 Alpha 的调节参数。弹性网络的似然罚值是与 Lasso 和岭估计方法关联的罚值的加权求和。“弹性网络 Alpha”决定这两个罚值的权重。请参见估计方法的统计详细信息和高级控件的统计详细信息。
调节参数为零时,不惩罚解,得到最大似然估计值。调节参数增大时,罚值增大。
解为一组参数估计值,它使惩罚负对数似然函数相对所选验证方法最小化。当前解在“解路径”图中用红色垂直实线标明。
注意:当“解路径”图中的“统一尺度的参数估计值量值”减小时,调节参数的值增大。接近 MLE 的估计值与大的量值关联,被严重惩罚的估计值则与小的量值关联。
请注意以下事项:
• 调节参数太小时,数据通常过拟合,生成方差很高的模型。
• 若调节参数太大,则数据通常拟合不足。
要得到一个解,请在细网格上增大调节参数。
• 对于 Lasso、指定了“弹性网络 Alpha”的弹性网络以及岭,给出解的调节参数值是在调节参数网格上提供最佳拟合的值。
注意:默认情况下,“弹性网络 Alpha”设置为 0.99。
• 若您未设置“弹性网络 Alpha”的值,则 alpha 的值也将在细网格上增大。对于固定的调节参数值,alpha 将不断变化,直到连续 10 个 alpha 值无法改进由验证方法决定的最佳拟合为止。对调节参数值的整个网格重复该过程。调节参数和 alpha 的最终值是在调节参数网格上提供最佳拟合的值。
调节参数值的网格范围从零(大多数情况)到使所有非截距项为零的最小值。定义使所有非截距项为零的调节参数的最小值为其上限。调节参数的下限为零,但是在以下两种情况下它设置为 0.0001:
• 若设计矩阵是奇异的,则无法计算最大似然估计值。下限 0.0001 允许计算接近 MLE 的估计值。
• 若选定的分布为二项或多项分布,则下限 0.0001 帮助阻止分离。
强制效应遗传
要求低阶效应在相关的高阶效应前进入模型。在多数情况下,这意味着 X2 不在模型中,除非 X 在模型中。对于“向前选择”之外的估计方法,有可能 X2 进入模型而在同一步中 X 离开模型。若数据表包含实验设计脚本,则启用该选项,但是默认情况下它是关闭的。
弹性网络 Alpha
设置弹性网络的 α 参数。该 α 参数确定用于估计弹性网络系数的 l1 和 l2 罚值调节参数的组合值。默认值为 α = 0.99,它设置 l1 罚值的系数为 0.99,设置 l2 罚值的系数为 0.01。仅当选择“弹性网络”作为“估计方法”时,该选项才可用。请参见估计方法的统计详细信息。
网格点数目
指定调节参数的下限和上限之间的网格点数目。在每个网格点值处,都获得这一调节参数值的参数估计值。默认值为 150 个网格点。
最小罚值率
指示调节参数的下限与上限之比的最小值。调节参数的下限为 0 时,解提供 MLE。在您不想包括 MLE 或很接近它的解的情况下,可以将“最小罚值率”设置为非零值。对于双 Lasso 估计方法,该选项的指定值仅用在拟合的第一阶段中。若设计矩阵中存在奇异性,则默认值为 0.0001。否则,默认值为 0。
网格尺度
提供用于选择网格尺度的分布的选项。您可以选择线性、平方根或对数尺度。与指定的网格点数数量相等的网格点将根据调节参数下限和上限之间的选定尺度来分布。默认网格尺度是平方根。请参见高级控件的统计详细信息。
第一阶段解
提供选项,用于选择双 Lasso 和两阶段向前选择的第一阶段中的解。默认情况下,根据指定的验证方法被视为最佳拟合的解将被选定,并且是最初显示的解(最佳拟合)。您可以选择最初显示一些模型,这些模型位于绿色或黄色区域中具有更大或更小 l1 范数值。例如,若您选择“黄色区域中最小”,最初显示的解将是黄色区域中具有最小 l1 范数的模型。请参见可比模型区域。
最大效应数
指定要在模型中为“最佳子集”估计方法考虑的最大效应数。您可以使用该选项限制拟合模型所需的计算次数。默认值为 10。
最初显示的解
提供的选项用于选择解,该解最初显示为“解路径”报表中的当前模型。当前模型通过一条垂直实线来标识。请参见当前模型指示符。最佳拟合解通过垂直虚线来标识。默认情况下,显示的解是根据指定的验证方法被视为最佳拟合的解。
您可以选择最初显示一些模型,这些模型位于绿色或黄色区域中具有更大或更小 l1 范数值。例如,若您选择“黄色区域中最小”,最初显示的解将是黄色区域中具有最小 l1 范数的模型。请参见可比模型区域。
自适应惩罚权重
提供用于计算自适应双 Lasso 的第二阶段中使用的惩罚权重的选项。默认情况下,选定“逆矩阵解”选项。该选项使用第一阶段拟合中的参数估计值计算惩罚权重。
“逆模型平均值”选项使用作为 AICc 或 BIC 模型加权平均值的解中的参数估计值计算惩罚权重。若选定 AICc 验证方法,则使用 AICc 模型。否则使用 BIC 模型。若使用“逆模型平均值”选项,最大似然解(若存在)则显示为“自适应双 Lasso”模型的解路径中的最右侧点。
强制项
允许您选择要将哪些项(若有)强制包括在模型中。强制包括在模型中的项不包括在罚值中。