拟合方程的示例
线性拟合和多项式拟合的“拟合汇总”报表
线性拟合和多项式拟合的“拟合汇总”报表中的 R 方值指示二次多项式拟合相对于线性拟合稍有改进。请参见“拟合汇总”报表
注意:仅当多行具有相同的 x 值时才会显示“失拟”报表。
使用“失拟”报表,无论您的模型形式是否正确,您都可以估计误差。当多个观测具有相同的 x 值时就会出现这种误差。为这些精确重复测量的误差称为纯误差。这是样本误差中无论使用哪种形式的模型都无法解释或预测的部分。不过,若失拟检验中的自由度不高(重复的 x 值不多),则失拟检验的用处不大。
线性拟合和多项式拟合的“失拟”报表的示例
模型剩余误差与纯误差之间的差值称为失拟误差。若回归变量的函数形式有误,则失拟误差可能显著大于纯误差。这种情况下,应该尝试不同类型的模型拟合。“失拟”报表检验失拟误差是否为零。
变异有三个来源:失拟纯误差总误差
每种误差来源的自由度 (DF)。
总误差自由度是“方差分析”表(显示在“方差分析”报表之下)的误差行中的自由度。该值是该表中的校正总和自由度与模型自由度之间的差值。误差自由度又分为失拟自由度和纯误差自由度。
纯误差自由度是各个分组的合并结果,这些分组中有多个行对每个效应都包含相同的值。请参见“失拟”报表
失拟自由度是总误差自由度与纯误差自由度之间的差值。
总误差平方和是相应的“方差分析”表(显示在“方差分析”报表之下)的误差行中的平方和。
纯误差平方和是各个分组的合并结果,这些分组中有多个行对 x 变量都包含相同的值。该统计量用来估计模型 x 效应无法解释的真正随机误差部分。请参见“失拟”报表
失拟平方和是总误差平方和与纯误差平方和之间的差值。若失拟平方和较大,则模型可能不适用于数据。下文所述的 F 比检验失拟导致的变异是否足够小,小到为纯误差的一个可忽略比例而被接受。
回归的方差分析 (ANOVA) 将样本总变异分为多个分量。这些分量用于计算 F 比,以便评估模型的有效性。若与 F 比关联的概率较小,则认为相对于响应均值本身,模型是更适合数据的统计拟合。
线性拟合和多项式拟合的“方差分析”报表的示例中的“方差分析”报表对线性拟合(拟合线)和二次拟合(拟合多项式)进行了比较。这两种拟合都是比均值水平线更适合的统计拟合。
线性拟合和多项式拟合的“方差分析”报表的示例
变异有三个来源:模型误差校正总和
针对计算中使用的每个参数估计值,都会从非缺失值总数 (N) 中减去一个自由度。总样本变异的计算使用均值的估计值。因此,需要从总数中减去一个自由度,得到 49。总校正自由度分为模型误差自由度。
总和中的一个自由度(显示在模型行上)用于估计线性拟合的单个回归参数(斜率)。两个自由度用于估计二次多项式拟合的参数()。
误差自由度是校正总和自由度与模型自由度之间的差值。
在本例中,每个响应与样本均值之间距离的总平方和(校正总和)为 57,278.157,如线性拟合和多项式拟合的“方差分析”报表的示例所示。 这是用于与其他所有模型进行比较的基本模型(或简单均值模型)的平方和。
对于线性回归,每个点与拟合线之间距离的平方和减至 12,012.733。这是在拟合模型后剩余或未解释的(误差)平方和。二次多项式拟合的剩余平方和为 6,906.997,该拟合比线性拟合所解释的变异略多一些。也就是说,该模型可解释更多变异,因为二次多项式的模型平方和比线性拟合的模型平方和要高。校正总和平方和减去误差平方和之后的值就是模型平方和。
线性拟合的模型均方为 45,265.4。该值估计误差方差,但仅是在模型参数为零的假设前提之下。
误差均方为 245.2。该值估计误差方差。
随机得到更大的 F 值观测到的显著性概率(p 值)(若指定的模型没有总体响应均值的拟合效果好)。观测到的显著性概率为 0.05 或更小通常被视为回归效应的证明。
对于 k 次多项式拟合,“参数估计值”报表包含模型截距的估计值,以及针对 X 变量所有 0 到 k 次幂的参数估计值。
线性拟合和多项式拟合的“参数估计值”报表的示例
列出从每个 t 比计算得出观测到的显著性概率。它是随机得到 t 比的绝对值大于计算值的概率(在原假设成立的前提下)。通常将 0.05(或有时为 0.01)以下的值解释为参数与零之间存在显著差异的证据。
要显示其他统计量,请在报表中右击并选择菜单。默认情况下不显示的统计量如下所示:
相关信息