“有效模型选择”算法以两个响应 YME 和 Y2nd 的形式表示响应 Y,以便 Y = YME + Y2nd
YME 是从针对主效应和假因子的 Y 回归获取的预测值。
由于设计的折叠结构,无需在 YME 中包含区组因子。区组因子包括在 Y2nd 中。
Y2nd 的计算公式为 Y2nd = Y - YME
注意:在 DSD 中,列 YME 和 Y2nd 正交。
阶段 2:响应 Y2nd 用于标识二阶效应。阶段 2 考虑阶段 1 中活跃主效应的二阶项,并确定这些包含效应中视为活跃的效应子集。
2.
使用 YME,针对该估计值检验主效应。p 值小于阈值 p 值的主效应被认为是活跃的。阈值如下:
3.
若没有任何主效应的 p 值小于阈值,则可认定没有活跃主效应和活跃的双因子效应。该过程到此为止。
1.
估计效应的绝对值(将 YME 用作响应)从最大到最小排列。
2.
对于每个 1  i < m,具有第 i 个最大绝对值的效应针对包含该效应和所有具有更大绝对值的效应的模型的调整残差平方和来进行检验。
3.
模型中具有最小 p 值的效应被视为活跃效应。
4.
若找到活跃主效应,则将 YME 用作响应,使用非活跃主效应的变异性构造误差方差的估计值。
1.
针对阶段 1 的误差估计值检验 Y2nd 的变异性,以确定是否存在因二阶效应导致更多的变异性。
若该检验的 p 值超过阈值,该过程将终止,不标识任何活跃的二阶效应。
2.
若该检验的 p 值小于等于阈值,则会从 k = 1 开始,接连检验大小为 kk = 1,2,3,... 的子集。
3.
对于每个 k,都针对阶段 1 的误差估计值检验该大小的每个子集的残差平方和。标识具有最小 RMSE 的子集。
5.
k 的末尾值对应的子集之前的子集中的效应被视为活跃的双因子效应。