线性回归模型的公式为 Y = Xβ + ε。在此,X 是这样一个矩阵:其第一列由 1 构成,其余列都是模型中非截距项的值。若模型包含 p 个项(包括截距),则 X 为一个 n x p 矩阵,其中 n 是观测数。参数估计值(用向量 b 表示)通常通过以下方式提供:
不过,该公式假定 X′X-1 存在,换言之,p × p 矩阵 X′X 是可逆的(等效于满秩)。若 X′X 不可逆则经常会出现问题,原因在于 X 各列之间存在线性相依性。
在这些情况下,矩阵 X′X 是奇异的,“拟合最小二乘法”报表包含“奇异性详细信息”报表。该报表包含描述线性相依性的表达式的表。这些线性相依性中涉及的项存在别名关系(混杂)。
图 3.64 显示了 Reactor 8 Runs.jmp 样本数据表的报表。要获取这些报表,请以反应百分比作为 Y 来拟合模型。输入进料速度、催化剂、搅拌速度、温度、浓度、催化剂*搅拌速度、催化剂*浓度以及进料速度*催化剂作为模型效应。
图 3.64 具有线性相依性的模型的“奇异性”和“参数估计值”报表