“信息性缺失”选项构造了编码系统,该系统允许在存在缺失值的情况下估计预测模型。该系统可同时支持对连续模型效应和分类模型效应编码。
若连续主效应包含缺失值,将创建新的设计矩阵列。该列是一个指示变量;若主效应列缺失则变量值为 1,若主效应列不缺失则变量值为 0。此外,连续主效应的缺失值将替换为一个均值,该均值是在分析中所包含行的非缺失值的均值。该均值是一个中性值,用于保持参数估计值的可解释性。
与该指示变量关联的参数用来对缺失值分组所预测的响应与预测响应(若协变量设置为其均值)之间的差值进行估计。
对于高阶效应,协变量中的缺失值将替换为协变量均值。这会使包含缺失值的行的高阶效应为 0(假定选中默认设置“中心多项式”)。这是因为“中心多项式”以多项式中涉及的各项的均值为这些项的中心。
在“效应检验”报表中,包含缺失值的每个连续主效应的参数数目都为 2。在“参数估计值”报表中,包含缺失值的连续主效应的参数标记为<列名>或均值(若缺失),且指标参数标记为<列名>缺失。保存到数据表的预测公式按照与这些模型参数对应的表达式来提供。
若名义型或有序型主效应包含缺失值,这些缺失值将单独编码为该效应的一个水平。因此,在“效应检验”报表中,包含缺失值的每个分类主效应都包含一个额外参数。
在“参数估计值”报表中,名义型效应的参数标记为<列名>[ ]。对于有序型效应,参数标记为<列名>[-x],其中的 x 表示具有最高值排序的水平。
和连续效应一样,保存到数据表的预测公式按照与这些模型参数对应的表达式来提供。
在使用“标准最小二乘法”特质时,您可以通过选择保存列 > 保存编码表来查看“信息性缺失”模型中使用的设计矩阵列。