在“广义回归”平台中,您可以使用应用于向前选择或 Lasso 模型的自验证集合建模 (SVEM) 方法。SVEM 方法是一种重新抽样方法,其中每一行在训练集和验证集中都被赋予非零权重。特定行的训练和验证权重是反相关的,因此对训练集有强烈影响的行对验证集的影响很弱,反之亦然。该方法对于分析设计实验的结果很有用。
该方法可概括为以下步骤:
1. 将设计矩阵的副本垂直追加到自身。原始设计矩阵有 n 行,所以新的设计矩阵有 2n 行以及与原始设计矩阵相同的列数。
2. 将响应向量的副本垂直追加到自身。新的响应向量的行数是原始响应向量的两倍。
3. 创建位置参数等于 1 的指数分布的 n 个随机值,其中 n 是原始设计矩阵的行数。这些是分配给设计矩阵的前 n 行的权重。
4. 创建与前 n 个随机值反相关的 n 个随机值。这些是分配给设计矩阵的后 n 行的权重。
5. 对生成的训练集和验证集拟合向前选择或 Lasso 模型,以获得一组参数估计值。
6. 为每一单个模型重复第 3 步到第 5 步。使用“模型启动”控制面板中的“样本”选项指定集合模型中单个模型的数量。
7. 对单个模型的参数估计值取平均值,以形成集合模型参数估计值。
注意:在“拟合模型”启动窗口中指定“验证”列后,将对训练集实施 SVEM 方法。验证和测试集作为测试集保留。
有关自验证集合建模 (SVEM) 方法的详细信息,请参见 Lemkus et al.(2021)。