刻画器指南 > 刻画器 > 评估变量重要性
发布日期: 08/07/2020

评估变量重要性

“变量重要性”报表计算用于测量模型因子重要性的指标,这些指标与模型类型和拟合方法无关。拟合模型仅用于计算预测值。该方法根据每个因子的变异范围估计预测响应的变异性。若因子中的变异引起响应变异较大,则该效应对模型十分重要。

注意:在某些平台中,对于包含两个以上水平的分类响应,“评估变量重要性”不可用。

还可以通过“图形”菜单中包含的“预测刻画器”来访问“评估变量重要性”。

有关统计详细信息,请参见评估变量重要性。另见 Saltelli (2002)。

注意:“评估变量重要性”要求所有列位于同一数据表。

“评估变量重要性”报表

“评估变量重要性”菜单包含以下选项,说明构造重要性指标时所用的方法:

独立均匀输入

对于每个因子,从最小和最大观测值所定义的均匀分布中抽取 Monte Carlo 样本。若您确信因子之间不相关且因子的可能值均匀分布在研究中所表示的范围内,则使用该选项。这是不涉及约束或混料因子的设计实验的合适选项。

独立再抽样输入

对于每个因子,通过对因子的一组观测值再抽样来获取 Monte Carlo 样本。若您确信因子之间不相关且因子的可能值不能通过均匀分布表示,则使用该选项。

非独立再抽样输入

使用 k 最近邻法从观测到的组合构造因子值,以便将相关性考虑在内。该选项将观测到的方差和协方差视为因子协方差结构的表示。若您确信因子之间相关,则使用该选项。请注意,该选项对于数据表中的行数很敏感。若用于少数行,结果可能不可靠。

注意:“独立再抽样输入”和“非独立再抽样输入”选项适用于观测研究。“独立”选项快于“非独立”选项,但是“非独立”选项可以更好地处理多重共线性,且不外推到远离数据的区域。

线性约束输入

对于每个因子,从线性约束所定义的区域上的均匀分布中抽取 Monte Carlo 样本。可以在“预测刻画器”中定义线性约束,或在设计实验中构造它们。此外,样本被限制为介于最小和最大观测值之间。当您认为这些约束影响输入的分布时,在存在线性约束的地方使用该选项。

这些算法的速度取决于模型求值速度。通常,速度最快的选项是“独立均匀输入”,速度最慢的选项是“非独立再抽样输入”。若估计过程无法即刻完成,可选择“接受当前指标”。

注意:使用 Monte Carlo 抽样构造变量重要性指标。因此,对于不同的试验运行过程,重要性指标值会有些许不同。

“变量重要性”报表

每个“评估变量重要性”选项都会提供汇总报表和边缘模型图。当“评估变量重要性”报表打开时,“预测刻画器”中的因子将根据其“总效应”重要性指标重新排序。若有多重响应,因子将根据“总体”报表中的“总效应”重要性指标重新排序。当您运行若干“变量重要性”报表时,“预测刻画器”中的因子将根据其在最近使用报表中的“总效应”指标排序。

汇总报表

对于每个响应,会有一个表显示以下元素:

关注的因子。

主效应

重要性指标,反映该因子本身(而不涉及与其他因子的组合)的相对贡献。

总效应

重要性指标,反映该因子本身以及与其他因子的组合的相对贡献。“总效应”列显示为一个条形图。请参见权重

主效应标准误差

“主效应”的重要性指标的 Monte Carlo 标准误差。这是一个隐藏列,您可以通过在报表中右击并选择列 > 主效应标准误差来访问该列。默认情况下,抽样会继续,直到该误差小于 0.01。计算详细信息在变量重要性标准误差中提供。(不适用于“非独立再抽样输入”选项。)

总效应标准误差

“总效应”的重要性指标的 Monte Carlo 标准误差。这是一个隐藏列,您可以通过在报表中右击并选择列 > 总效应标准误差来访问该列。默认情况下,抽样会继续,直到该误差小于 0.01。计算详细信息在变量重要性标准误差中提供。(不适用于“非独立再抽样输入”选项。)

权重

一个显示“总效应”指标的图,位于最后一列的右侧。您可以取消选择或重新选择该图,只需在报表中右击并选择列 > 权重即可。

带有缺失值的函数求值的比例

某些输入组合生成无法估计的预测时的 Monte Carlo 样本的比例。若该比例不为零,该消息会作为注释显示在表的底部。

注意:若有多重响应,“汇总报表”会提供一个“总体”表,后跟每个响应的表。“总体”报表中的重要性指标是所有响应的重要性指标的平均值。

边缘模型图

“边缘模型图”报表(请参见“预测刻画器”中的绿色误差传播直条)显示了图矩阵,每个响应都有一行,每个因子都有一列。因子根据其总体“总效应”重要性指标的大小来排序。

对于给定的响应和因子,图中显示每个因子值的响应均值,该均值是对用于计算重要性指标的所有输入所取的平均值。这些图不同于刻画器图,刻画器图显示的是响应的横截面。“边缘模型图”对于评估因子的主效应很有用。

请注意,所选的输入方法将影响在边缘模型图上标绘的值。此外,由于这些图基于生成的输入设置,标绘的响应均值可能不显示为平滑曲线。

红色小三角菜单选项支持您显示或隐藏图的以下方面:

估计值

作为因子值函数计算的模拟值均值的平滑估计。

注意:因为是模拟均值的估计值,因此当重新运行分析时这些值可能更改。

置信区间

模拟均值的 95% 置信带。这个带通常很窄,若不扩展尺度,可能无法看到。不适用于“非独立再抽样输入”。

注意:因为置信界限是模拟的,因此当重新运行分析时这些带可能更改。

数据

针对因子值标绘的响应的实际(非模拟)值。

“变量重要性”选项

“变量重要性”红色小三角菜单包含以下选项:

按主效应重要性对因子重新排序

按照主效应的重要性指标(主效应)对“预测刻画器”中的单元格重新排序。

按总重要性对因子重新排序

按照因子的总重要性指标(总效应)对“预测刻画器”中的单元格重新排序。

着色刻画器

使用由红到白的强度尺度按照“总效应”重要性指标对刻画器中的单元格着色。

注意:您可以点击“汇总报表”中的行以选择数据表中的列。这有利于进一步分析。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).