将标准模型选择方法应用于 DSD 时,这些方法可能无法标识活跃效应。请参见 Errore et al. (2017)。此外,标准选择方法不利用 DSD 的结构。“拟合确定性筛选”平台使用“DSD 的有效模型选择”方法,该方法充分利用 DSD 的结构。
Jones and Nachtsheim (2016) 为使用“DSD 的有效模型选择”方法和标准方法的模拟研究提供了报告。用 c 来表示 DSD 中的因子数与假因子数的总和。在许多情况下,若活跃主效应数超过三个,则可以可靠标识 c/2 个活跃二阶效应。假定存在强效应遗传,若有三个或三个以下的活跃主效应,则可以可靠地标识所有活跃的二阶效应。可靠标识意味着系数绝对值与误差标准差的比值超过了 3 并且检测效应的功效超过了 0.80。
“拟合确定性筛选”平台的默认设置假定存在强效应遗传。强效应遗传意味着仅当同时包含 A 和 B 时才考虑在模型中包含 A*B 交互作用。强效应遗传要求将模型效应的所有低阶成分都包含在模型中。在标识活跃的二阶效应时,该算法使用强效应遗传和之前引述的关于可以可靠标识多少活跃二阶效应的结果。
在 DSD 中,主效应和二阶效应彼此正交。“DSD 的有效模型选择”方法利用了这一事实。响应的线性空间划分到主效应生成的子空间和该子空间的正交补空间中。Miller and Sitter (2005) 将主效应横跨的线性子空间称为奇空间,因为它包含关于奇效应(主效应、3 因子效应、5 因子效应等)的所有信息。他们将其正交补称为偶空间,因为它包含关于偶效应的所有信息:截距、2 因子效应、4 因子效应等。
拟合确定性筛选采用的就是上述思路。主效应横跨的子空间就是奇空间。其正交补(偶空间)包含二阶效应和区组变量(若存在)。有关算法的详细信息,请参见“DSD 的有效模型选择”算法和 Jones and Nachtsheim (2016)。