切记确定性数据没有随机成分。相同的输入值生成相同的输出。因此,拟合的统计模型中的 p 值不具有通常的含义。大的 F 统计量(低 p 值)指示模型项带来的效应。但是,您不能构造效应或模型预测的有效置信区间。
对确定性数据的模型拟合的残差并不是噪声的测度。残差是模型偏倚的测度。偏倚是真实值与预测值的差值。残差中的非重复模式指示应为模型考虑其他项来减小偏倚。
真实模型通常无法在简单解析表达式中提供。因此,仅知道观测的数据点处的预测偏倚。但是,在本示例中,真实模型的函数形式是已知的。在 Borehole Sphere Packing.jmp 数据表中,真实模型列包含已知函数的公式。通过该公式,您可以刻画因子输入区域上的预测偏倚。
1. 选择帮助 > 样本数据库,然后打开 Design Experiment/Borehole Sphere Packing.jmp。
2. 点击“模型”(“实验设计”中的高斯过程)脚本旁边的绿色小三角。
使用“高斯过程模型”报表探索因子和结果 Y 之间的关系。
3. 点击“‘Y’的高斯过程模型”旁边的红色小三角,然后选择保存预测公式。
4. 返回到 Borehole Sphere Packing.jmp 数据表。
5. 在数据网格中,选择真实模型和 Y 预测公式的列标题。
6. 右击并选择新建公式列 > 合并 > 差值。
这将创建包含偏倚的新列。
7. 从 Borehole Sphere Packing.jmp 数据表,选择图形 > 刻画器。
8. 选择真实模型-Y 预测公式并点击 Y,预测公式。
9. 选择展开中间公式。
该选项将偏倚显示为八个设计因子的函数。
图 21.30 钻孔球堆积数据的刻画器对话框
10. 点击确定。
刻画器默认为设计区域的中心。若没有偏倚,则所有刻画迹线在每个因子的值范围之间将为常数。在本示例中,变量 logRw、Hu 和 Hl显示对偏倚的最大效应。
图 21.31 钻孔高斯过程模型(Y 轴设置为 -30 到 30)的偏倚刻画器
您可以使用刻画器探索整个域上预测偏倚的范围。要找到最小和最大偏倚点,请从“预测刻画器”红色小三角菜单中选择最优化和意愿 > 意愿函数。请参见《刻画器指南》中的意愿刻画和优化。要评估设计点上的预测偏倚,请选择分析 > 分布来查看分布分析。
图 21.32 预测偏倚的分布
切记,在本示例中,真实模型是已知的。在很多应用中,任何因子设置的响应都是未知的。实验数据上的预测偏倚可能低估了整个设计域上的偏倚。