以下方法可用于模型拟合的验证:
注意:唯一可用于“分位数回归”的验证方法为“无”。可用于“最大似然”估计方法的验证方法只有“无”和“验证列”。可用于“Cox 比例风险”的验证方法只有 BIC、AICc 和“无”。Dantzig 选择器估计方法只允许使用 BIC 和 AICc 验证方法。
K 重
对于调节参数的每个值,都将执行以下步骤:
‒ 观测划分到 k 个子集或重中。
‒ 每一重都轮流用作一个验证集。针对不含在“重”中的观测拟合模型。针对“重”中的观测计算基于该模型的对数似然,同时提供验证对数似然。
‒ 计算 k 重的验证对数似然的均值。该值充当调节参数值的验证对数似然。
具有最大验证对数似然的调节参数的值用于构造最终解。要获取最终模型,将对整个数据集拟合从调节参数最优值得到的全部 k 个模型。在这些模型中,具有最高的验证对数似然的模型将被选为最终模型。用于该最终模型的训练集将被指定为训练集,并且该模型的“维持”重是验证集。这些就是在最终解的图中和报表结果中使用的训练集和验证集。
保留
随机选择指定比例的数据作为验证集,并使用除验证集外的数据拟合模型。最终解是将验证集的负对数似然最小化的解。该方法对于大数据集很有用。随机选择基于对模型因子的分层抽样,以尝试创建比基于简单随机抽样的训练集和验证集更平衡的训练集和验证集。
留一法
执行留一法交叉验证。这等价于 K 重,其折数等于行数。该选项不应在中等或大数据集中使用。即使中等数量的观测值,它也可能需要很长的处理时间。将按照对 K 重验证那样来确定最终解的图中和报表结果中使用的训练集和(一行)验证集。
BIC
使解路径上的 Bayesian 信息准则 (BIC) 最小化。请参见似然、AICc 和 BIC。
AICc
使解路径上的校正的 Akaike 信息准则 (AICc) 最小化。AICc 是“验证方法”的默认设置。请参见似然、AICc 和 BIC。
注意:当参数数目接近或超过样本大小时不定义 AICc。
ERIC
使解路径上的扩展正则信息准则 (ERIC) 最小化。请参见模型拟合详细信息。仅可用于指数系列分布以及 Lasso 和自适应 Lasso 估计方法。
无
不使用验证。仅可用于“最大似然估计方法”和“分位数回归”。
验证列
使用在“拟合模型”窗口中指定的列作为具有“验证”角色。最终解是将验证集的负对数似然最小化的解。当指定的估计方法为 Dantzig 选择器或是指定的分布为“分位数回归”或“Cox 比例风险”时,该选项不可用。