<交叉验证方法> 和方法 = <方法指定>

仅当在“模型启动”控制面板中将某种交叉验证方式选为“验证方法”时，才显示该报表。它显示模型拟合的汇总统计量，拟合所用的因子数为 0 到提取的最大因子数（在“模型启动”控制面板中指定）。该报表还提供“PRESS 均值根值图”。请参见 PRESS 均值根图。使用最小 PRESS 均值根统计量标识最佳因子数。

“交叉验证”报表

当选定标准化 X 选项时，标准化会应用到整个数据表一次。它不会重新应用到各个训练集。但是，当选定中心化或统一尺度选项的任意组合时，该选择组合会应用到每个交叉验证训练集。使用这些训练集执行交叉验证，若选定这些选项则会对它们单独进行中心化和统一尺度。

报表中显示以下统计量。若使用了任何形式的验证或交叉验证，则报告的结果是训练集统计量的汇总。

因子数

拟合模型时使用的因子数。

PRESS 均值根

所有响应的 PRESS 值的平均值的平方根。详细信息，请参见 PRESS 均值根。

van der Voet T2

van der Voet 检验的统计量，它检验具有不同提取因子数的模型是否与最佳模型存在显著差异。每个 van der Voet T2 检验的原假设假定基于相应因子数的模型与最佳模型没有差异。备择假设是该模型与最佳模型有差异。有关更多详细信息，请参见van der Voet T2。

概率 > van der Voet T2

van der Voet T2 检验的 p 值。有关更多详细信息，请参见van der Voet T2。

预测能力的无量纲测度，它定义为：从 1 中减去 PRESS 值除以 Y 的总平方和所得的比值，即：

详细信息，请参见 Q2 的计算。

累积 Q2

具有给定因子数或更少因子数的模型的预测能力指标。对于给定的因子数 f，按以下方式定义累积 Q2 ：

此处 PRESSi 和 SSYi 对应于它们针对 i 个因子的值。

R2X

由指定因子解释的 X 变异的百分比。具有较大 R2X 的成分解释 X 变量中的大部分变异。请参见使用验证时 R2X 和 R2Y 的计算。

累积 R2X

具有给定因子数的模型所解释的 X 变异的百分比。它是 R2X 值之和（ i = 1 到给定的因子数）。

R2Y

由指定因子解释的 Y 变异的百分比。具有较大 R2Y 的成分解释 Y 变量中的大部分变异。请参见使用验证时 R2X 和 R2Y 的计算。

累积 R2Y

具有给定因子数的模型所解释的 Y 变异的百分比。它是 R2Y 值之和（i = 1 到给定的因子数）。

Q2 和累积 R2Y 的解释

统计量 Q2 和累积 R2Y 均可衡量模型的预测能力，但方法不同。

•	累积 R2Y 随因子数的增加而增大。这是因为随着因子添加至模型，更多的变异得到解释。

•	Q2 的趋势是随因子数的增加，先增大后减小（或至少停止增大）。这是因为随着更多的因子添加至模型，模型开始调整训练集，不能很好地推广到新数据，导致 PRESS 统计量减小。

Q2 和累积 R2Y 分析是 van der Voet 检验的一个替代方法，用于确定要在模型中包括多少因子。选择一个因子数，使得 Q2 较大且没有开始减小。您还希望累积 R2Y 较大。

Penta.jmp 的累积 R2Y 和 Q2显示 Penta.jmp 数据表针对因子数标绘的累积 R2Y 和 Q2，验证方法为“留一法”。累积 R2Y 增加，并且在大约四个因子时开始趋于平稳。统计量 Q2 在两个因子时最大，然后开始趋于平稳。该图表明具有两个因子的模型将能够解释 Y 中的大部分变异，且不会过拟合数据。

Penta.jmp 的累积 R2Y 和 Q2

PRESS 均值根图

该条形图在水平轴上显示因子数，在垂直轴上显示“RESS 均值根”值。它等效于在“交叉验证”报表中显示在“RESS 均值根”列右侧的水平条形图。请参见 “交叉验证”报表。

PRESS 均值根

对于指定的因子数 a，按以下方式计算“PRESS 均值根”：

1.	对每个训练集拟合具有 a 个因子的模型。

2.	将得到的预测公式应用到验证集中的观测。

对于每个 Y：

‒	对于每个验证集，计算每个验证集的观测值与其预测值的差值平方（预测误差平方）。

‒	对于每个验证集，求这些差值平方的平均值并将结果除以按如下所示计算的响应的方差估计值。对于“K 重”和“留一法”验证方法，除以整个响应列的方差。对于“保留”验证方法，除以训练集中响应值的方差。