拟合线性模型 > 广义回归模型 > 模型拟合选项

发布日期: 04/13/2021

模型拟合选项

每个模型拟合报表具有带以下选项的红色小三角菜单：

警告：若在启动窗口中指定的列具有“表达式”数据类型或“向量”建模类型，则该平台中的许多选项都不可用。

回归报表

支持您定制为指定的模型拟合所显示的报表。除了“中心化和统一尺度的预测变量的参数估计值”报表和“活跃参数估计值”报表，默认显示以下所有报表。

模型汇总

显示或隐藏包括有关模型的规格和拟合优度统计量信息的“模型汇总”报表。该选项还为适用的模型显示“估计详细信息”报表。请参见模型汇总和估计详细信息。

解路径

（不可用于最大似然模型。）显示或隐藏“解路径”图和“验证路径”图。请参见解路径。

中心化和统一尺度的预测变量的参数估计值

显示或隐藏中心化和统一尺度的参数估计值表。请参见中心化和统一尺度的预测变量的参数估计值。

原始预测变量的参数估计值

显示或隐藏采用数据原始尺度的参数估计值表。请参见原始预测变量的参数估计值。

活跃参数估计值

（不可用于最大似然或岭回归模型。）显示或隐藏当前选定模型的活跃或非零参数估计值的表。

显示解路径汇总

（不可用于最大似然或岭回归模型。）显示或隐藏一个报表，其中包含解路径上的点的拟合统计量的表以及活跃集发生更改的验证路径图。可用的统计量取决于估计方法。有关可用于“使用‘BIC 验证’的‘正态’‘Lasso’”模型的条件模型概率的详细信息，请参见 Hu et al.(2019)。

效应检验

显示或隐藏每个效应的检验。给定效应的效应检验用来检验以下原假设：与该效应关联的所有参数均为零。根据名义型或有序型效应的水平数，此类效应可有若干关联参数。此类效应的效应检验用于检验所有关联参数是否均为零。当分布为“多项式”时，将针对响应的各个水平合并效应。请参见效应检验。

显示预测表达式

显示或隐藏包含估计模型的方程的“预测表达式”报表。相关示例，请参见显示预测表达式。

选择非零项

在报表中突出显示具有非零系数的项。同时选定数据表中的所有关联列。将“岭回归”选作估计方法时，该选项不可用。

选择清零项

在报表中突出显示具有零系数的项。同时选定数据表中的所有关联列。将“岭回归”选作估计方法时，该选项不可用。

重新启动活跃集

（不适用于包含具有“矢量”建模类型的预测变量的模型。）包含的选项用于打开“拟合模型”启动窗口，其中的“构造模型效应”列表包含基于具有非零参数估计值的项的一组项。这些项即活跃效应。启动窗口中的所有其他规格都是在原始分析中使用过的。

注意：若您在包含“依据”变量的报表中选择任何“重新启动活跃集”选项，该“依据”变量不会添加至“拟合模型”启动窗口。

使用活跃效应重新启动

仅使用活跃效应填充“构造模型效应”列表。

重新启动活跃的主效应和二阶析因

使用用活跃效应构造的二阶析因填充“构造模型效应”列表。

重新启动活跃的主效应和三阶析因

使用用活跃效应构造的三阶析因填充“构造模型效应”列表。

重新启动活跃的主效应和完全析因

使用用活跃效应构造的完全析因填充“构造模型效应”列表。

重新启动活跃的主效应和二阶多项式

使用用活跃效应构造的二阶多项式填充“构造模型效应”列表。

重新启动活跃的主效应和三阶多项式

使用用活跃效应构造的三阶多项式填充“构造模型效应”列表。

重新启动活跃的主效应和响应曲面模型

使用用活跃效应构造的响应曲面模型填充“构造模型效应”列表。

隐藏不活动的路径

调整“解路径参数估计值”图中不活动路径的透明度以使当前不活动的路径变淡显示。

优势比

（仅当指定的分布为“二项”并且模型包含截距时才可用。不适用于包含具有“矢量”建模类型的预测变量的模型。）显示一个报表，其中包含分类预测变量的优势比，以及连续预测变量的单位优势比和范围优势比。优势比是两个事件的优势之比。事件的优势是指相关事件发生的概率与该事件不发生的概率的对比情况。相关事件由“拟合模型”启动窗口中的“目标水平”来定义。

对于每个分类预测变量，都显示一个“优势比”报表。为分类模型项水平的所有组合都显示优势比。

若存在连续预测变量，还会显示另外两个报表：

‒ “单位优势比”报表。针对连续模型项中一个单位的更改计算单位优势比。

‒ “范围优势比”报表。针对连续模型项中整个范围的更改计算范围优势比。

“优势比”报表中的置信区间为基于 Wald 的区间。请注意，仅当模型项未涉及任何更高阶效应时该模型项的优势比才有意义。

注意：若模型中包含交互作用，您可以使用“多重比较”选项获取优势比。请参见多重比较。

发生率比

（仅当指定的分布为“Poisson”或“负二项”并且模型包含截距时才可用。）显示一个报表，其中包含分类预测变量的发生率比，以及连续预测变量的单位发生率比和范围发生率比。发生率比是两个事件的发生率之比。模型项的发生率是发生在给定时间期间的新事件数。

对于每个分类预测变量，都显示一个“发生率比”报表。为分类模型项水平的所有组合都显示发生率比。

若存在连续预测变量，还会显示另外两个报表：

‒ “单位发生率比”报表。针对连续模型项中一个单位的更改计算单位发生率比。

‒ “范围发生率比”报表。针对连续模型项中整个范围的更改计算范围发生率比。

“发生率比”报表中的置信区间为基于 Wald 的区间。请注意，仅当模型项未涉及任何更高阶效应时该模型项的发生率比才有意义。

危险比

（仅当指定的分布为“Cox 比例风险”并且模型包含截距时才可用。）显示一个报表，其中包含分类预测变量的危险比，以及连续预测变量的单位危险比和范围危险比。危险比是两个事件的危险比率之比。某事件在时间 t 时的危险率是该事件不会额外存续一段时间的条件概率，前提是该事件已经存续到时间 t。

对于每个分类预测变量，都显示一个“危险比”报表。为分类模型项水平的所有组合都显示危险比。

若存在连续预测变量，还会显示另外两个报表：

‒ “单位危险比”报表。针对连续模型项中一个单位的更改计算单位危险比。

‒ “范围危险比”报表。针对连续模型项中整个范围的更改计算范围危险比。

“危险比”报表中的置信区间为基于 Wald 的区间。请注意，仅当模型项未涉及任何更高阶效应时该模型项的危险比才有意义。

估计值的协方差

显示一个矩阵，其中显示参数估计值的协方差。这些值是使用 M 估计和夹层公式（Zou 2006 和 Huber and Ronchetti 2009）计算得到的。协方差矩阵不包含零项。

估计值的相关性

显示一个矩阵，其中显示参数估计值的相关性。这些值是使用 M 估计和夹层公式（Zou 2006 和 Huber and Ronchetti 2009）计算得到的。相关性矩阵不包含零项。

逆预测

（不适用于包含具有“矢量”建模类型的预测变量的模型。）在给定 Y 和其他 X 变量的特定值的情况下预测某个 X 值。只能用于预测连续变量。有关“逆预测”的详细信息，请参见逆预测。

多重比较

（不适用于包含具有“矢量”建模类型的预测变量的模型，或不包含任何分类预测变量的模型。）显示“多重比较”启动窗口。有关“多重比较”启动窗口和报表的详细信息，请参见多重比较。请注意多重比较是在线性预测变量尺度上执行的。若指定的分布为“二项式”，则针对优势比执行多重比较。若指定的分布为 Poisson，则针对发生率比执行多重比较。若指定的分布为“Cox 比例风险”，则针对危险比执行多重比较。

混淆矩阵

（仅当指定的分布为“二项式”、“多项式”或“有序型 Logistic”时才可用。）显示一个矩阵，该矩阵是实际响应水平与预测响应水平的表格。对于好的模型，预测响应水平应与实际响应水平相同。混淆矩阵支持您评估预测响应与实际响应的相符程度。若使用了验证，将为每一个训练集、验证集和测试集都显示一个混淆矩阵。

设置概率阈值

（仅当指定的分布为“二项”时才可用。）指定用于对响应分类的截止概率。默认情况下，若某个观测的预测概率超过 0.5，则该观测将分类到“目标水平”中。更改该阈值，指定 0.5 之外的值作为分类到“目标水平”的截止值。混淆矩阵中的“预测比率”随之更新，根据指定的阈值以反映分类。

若响应具有“收益矩阵”列属性，则概率阈值的初始值由收益矩阵确定。

刻画器

（不适用于包含具有“矢量”建模类型的预测变量的模型。）提供支持您探索拟合模型的各种刻画器。

注意：若行数小于等于 500 而预测变量数小于等于 30，当您在任一个“解路径”图中拖动当前模型指示符时，刻画器图将随之不断更新。如若不然，刻画器图将在您释放鼠标按钮时更新。

刻画器

显示“预测刻画器”。参数估计值为零且未涉及任何带有非零系数的交互作用项的预测变量不显示在该刻画器中。有关“预测刻画器”的详细信息，请参见《刻画器指南》中的刻画器。

“分布”刻画器

（当指定的分布为“二项”或“分位数回归”时不可用。）显示预测变量与响应的累积分布函数的刻画器。该响应显示在最右侧的单元格中。

分位数刻画器

（当指定的分布为“二项”或“分位数回归”时不可用。）显示一个刻画器，该刻画器显示预测响应（作为预测变量的函数）以及累积分布函数的分位数。该分位数称为“概率”，显示在最右侧的单元格中。

生存刻画器

（仅当指定的分布为“正态”、“指数”、“Weibull”、“对数正态”或“Cox 比例风险”时才可用。）显示一个刻画器，该刻画器显示作为预测变量和响应的函数的生存函数。该响应显示在最右侧的单元格中。

危险率刻画器

（仅当指定的分布为“正态”、“指数”、“Weibull”、“对数正态”或“Cox 比例风险”时才可用。）显示一个刻画器，该刻画器显示作为预测变量和响应的函数的危险率。该响应显示在最右侧的单元格中。

定制检验

显示支持您检验定制假设的“定制检验”报表。若模型有“解路径”，定制检验结果将随着您更新解而更新。有关定制检验的详细信息，请参见定制检验。“定制检验”红色小三角菜单包含一个用于删除“定制检验”报表的选项。

诊断图

提供各种图，用来帮助评估当前模型拟合的好坏。若指定了“验证”列，或者选择“K 重”、“保留”或“留一法”作为“验证方法”，下面的选项会支持您查看训练集、验证集以及测试集（若适用），或是为这些集构造相应的图。若选择“K 重”或“留一法”，则这些图对应于优化预测误差的验证集及其相应的训练集。请参见K 重。

注意：所有诊断图都会随着您在任一个“解路径”图中拖动当前模型指示符时不断更新。

诊断包

（当指定的分布为“二项式”、“多项式”、“有序型 Logistic”或“Cox 比例风险”时不可用。）显示一组四个图形：“预测值-残差”图、“行号-残差”图、残差直方图以及观测响应大于观测到的响应的概率直方图。

这些图形都是使用所有观测构造的。若使用了“验证”列，或者选择“K 重”、“保留”或“留一法”作为“验证方法”，则可通过复选框选择训练集、验证集以及测试集（若适用）。与这些集对应的行在数据表中会被相应地选定，而且相应的点和区域会在图形中突出显示。使用该选项可确定模型拟合在各个集之间是否相似。

“观测较大响应的拟合概率”直方图帮助您评估模型的拟合优度。基于分布应用不同准则：

‒ 对于零泛滥分布和分位数回归之外的分布，“正确”模型应显示近似均匀的值分布。

‒ 对于零泛滥分布，该直方图应在零处显示点质量，在其他位置显示近似均匀分布。

‒ 对于分位数回归，该直方图应在指定的分位数左侧显示近似均匀的值分布，在指定的分位数右侧显示稍微高一些的值的近似均匀分布。

标绘基线生存和危险率

（仅当指定的“分布”为“Cox 比例风险”时才可用。）显示“基线生存和危险率”图，这些图为基线比例风险函数标绘随响应变量变化的生存和危险率函数。在这些图下方，有一个包含标绘值的表。

注意：若指定的分布为“Cox 比例风险”，则“标绘基线生存和危险率”选项是唯一可用的诊断图。

ROC 曲线

（仅当指定的分布为“二项式”、“多项式”或“有序型 Logistic”时才可用。）显示“受试者操作特征 (ROC)”曲线。若使用了验证，将为每一个训练集、验证集和测试集都显示一条 ROC 曲线。

ROC 曲线测量拟合概率正确地对响应水平分类的能力。曲线距离对角线越远，拟合效果越好。有关 ROC 曲线的简介，请参见《基本分析》中的ROC 曲线。

若响应的水平数超过两个，则“ROC 曲线”图会为每个响应水平显示一条 ROC 曲线。对于给定的响应水平，该曲线是正确分类到该水平的 ROC 曲线。有关 ROC 曲线的详细信息，请参见《预测和专业建模》中的ROC 曲线。

提升曲线

（仅当指定的分布为“二项式”、“多项式”或“有序型 Logistic”时才可用。）显示模型的提升曲线。若使用了验证，将为每一个训练集、验证集和测试集都显示一条 ROC 曲线。

提升曲线显示在拟合概率降低时响应水平被分类的有效程度。拟合概率沿水平轴以降序标绘。拟合概率的垂直坐标是该概率（或更高）的正确分类的比例除以总正确分类率的结果。使用提升曲线可查看在您仅选择拟合概率超过阈值的那些观测的情况下，您是否能够对较大比例的观测正确分类。

若响应的水平数超过两个，则“提升曲线”图会为每个响应水平显示一条提升曲线。对于给定的响应水平，该曲线是正确分类到该水平的提升曲线。有关提升曲线的详细信息，请参见《预测和专业建模》中的提升曲线。

标绘“预测值-实际值”图

（当指定的分布为“二项式”、“多项式”、“有序型 Logistic”或“Cox 比例风险”时不可用。）在垂直轴上标绘实际 Y 值，在水平轴上标绘预测的 Y 值。若使用了验证，将为每一个训练集、验证集和测试集都显示一个图。

标绘“预测值-残差”图

（当指定的分布为“二项式”、“多项式”、“有序型 Logistic”或“Cox 比例风险”时不可用。）在垂直轴上标绘残差，在水平轴上标绘预测的 Y 值。若使用了验证，将为每一个训练集、验证集和测试集都显示一个图。

标绘“预测变量-残差”图

（当指定的分布为“二项式”、“多项式”、“有序型 Logistic”或“Cox 比例风险”时不可用。不适用于包含具有“矢量”建模类型的预测变量的模型。）对于模型中的每个预测变量，在垂直轴上标绘残差，在水平轴上标绘预测变量值。模型中的每个预测变量都对应一个图。若使用了验证，将为每一个训练集、验证集和测试集都显示一组图。

正态分位数图

（仅当指定的分布为“正态”且无删失时才可用。）在垂直轴上绘制正态分位数，在水平轴上绘制标准化残差。若使用了验证，将为每一个训练集、验证集和测试集都显示一个图。

保存列

支持您将基于拟合模型的列保存到数据表中。有关在将“Cox 比例风险”选作分布时可用的选项的详细信息，请参见保存用于 Cox 比例危险模型的列选项。对于其他所有分布，可以将以下列保存到数据表中：

保存函数预测公式

（仅当响应列包含“FDE FPC 数”列属性时才可用。）将每个 FDE 主成分响应对应的列保存到包含每个函数主成分的预测公式的数据表。该选项还添加模型预测公式，该公式是预测公式与“函数数据分析器”平台中的特征函数列的线性组合。将向数据表中添加一个脚本，该脚本支持您使用模型预测公式刻画原始响应，该响应在 FDE 主成分响应列的“FDE 输出”列属性中指定。有关函数主成分的详细信息，请参见《预测和专业建模》中的函数数据分析器。

“保存函数预测公式”选项用于保存报表窗口中所有 FDE 主成分响应的公式列。若为单个响应拟合多个模型，则使用每个响应的最终模型来创建该响应的预测公式。

保存预测公式

将包含预测公式（用观测的（非标准化）数据值形式给出）的列保存到数据表中。预测公式不包含清零项。有关均值公式，请参见分布的统计详细信息。

若响应列为分类响应，该选项将为每个响应水平创建一个概率列，并创建一个包含最可能响应的列。最可能的响应列包含具有基于模型的最高概率的水平。若“概率阈值”是 0.5 之外的值，该选项可创建一个附加列，其中包含基于概率阈值的最可能的响应。

均值置信区间

将包含响应均值的 95% 置信下限和上限的两列保存到数据表中。

注意：通过从“模型规格”红色小三角菜单中选择“设置 Alpha 水平”，您可以在“拟合模型”窗口中更改置信区间的 α 水平。

预测值标准误差

将包含预测响应均值的标准误差的列保存到数据表中。

保存残差公式

将包含残差公式（用 Y 减去预测公式形式给出）的列保存到数据表中。残差公式不包含清零项。若将“二项”选作分布，则不可用。

保存方差公式

将包含预测方差公式的列保存到数据表中。使用选定分布的方差公式计算预测的方差。通过将连结函数的反函数应用到估计的线性成分来估计连结函数中涉及的参数值。其他参数用其估计值替代。有关方差公式，请参见分布的统计详细信息。若将“二项”选作分布，则不可用。

保存线性预测变量

将包含设计矩阵与参数估计值向量乘积公式的列保存到数据表中。这通常称为 Xβ。该公式不包含清零项。

保存验证列

（仅当指定的“验证方法”为“K 重”、“保留”或“留一法”时才可用。）保存一个列，该列说明如何将行分配给重。对于“K 重”，该列列出各行被分配到第几重。对于“保留”，将每行标识为属于训练集或验证集。对于“留一法”，行的值指示它被剔除的顺序。

注意：若您在启动窗口中选择了“验证”列，将不显示“保存验证列”选项。

保存模拟公式

将使用估计参数为您拟合的模型生成模拟值的公式所在的列保存到数据表中。该列可用在模拟实用工具中，作为“换入列”。请参见《基本分析》中的模拟。

Cook 距离影响

（仅当指定的分布为“正态”且指定的估计方法为“标准最小二乘法”时才可用。）将包含“Cook 距离影响”统计量值的列保存到数据表中。

帽子值

（仅当指定的分布为“正态”且指定的估计方法为“标准最小二乘法”时才可用。）将包含 X(X‘X)-1X‘ 的对角线元素的列保存到数据表中。这些值有时称为帽子值。

发布预测公式

创建预测公式并将它们保存为“公式存储库”平台中的公式列脚本。若未打开“公式存储库”报表，该选项将创建“公式存储库”报表。请参见《预测和专业建模》中的公式存储库。

保存用于 Cox 比例危险模型的列选项

保存生存公式

将包含观测时的生存概率公式的列保存到数据表中。

保存 Cox Snell 残差公式

将包含 Cox-Snell 残差公式的列保存到数据表中。Cox-Snell 残差为严格正数。有关 Cox-Snell 残差的说明，请参见 Meeker and Escobar (1998, sec. 17.6.1)。

保存 Martingale 残差公式

将包含 Martingale 残差公式的列保存到数据表中。Martingale 残差定义为某个个体的观测事件数与有条件预期事件数之间的差值。Martingale 残差的均值为零，范围介于负无穷大和 1 之间。请参见 Fleming and Harrington (1991)。

保存线性预测变量

将包含设计矩阵与参数估计值向量乘积公式的列保存到数据表中。这通常称为 Xβ。该公式不包含清零项。

删除拟合

删除拟合的报表。

需要更多信息？有问题？从 JMP 用户社区得到解答 (community.jmp.com).