发布日期: 09/18/2023

“跨越折汇总”报表

“模型筛选”平台中的“跨越折汇总”报表包含跨越折的拟合测度汇总,若指定了“重复 K 折”则还将包含针对试验的拟合测度汇总。若指定了“K 折交叉验证”选项,则针对各个验证集来汇总拟合测度。若指定了“嵌套交叉验证”选项,则针对各个测试集来汇总拟合测度。该报表还包含具有以下列的表:

方法

用于拟合模型的方法的名称。

N 次试验折数

对所有折和试验(若适用)拟合的模型总数。

频数总和

验证或测试集中观测的平均数。测试集用于估计模型性能。

R 方

所有验证或测试集折的 R 方均值。若响应为分类响应,该列包含“熵 R 方”。

RASE 均值

所有验证或测试集折的 RASE(均方根误差)的均值。

标准差 RASE

跨越所有验证或测试集的 RASE 的标准差。

AUC 均值

(仅可用于分类响应。)跨越所有验证或测试集的 ROC 曲线 (AUC) 下的均值区域。

均值 MR

(仅可用于分类响应。)所有验证或测试集的误分类率 (MR) 均值。

表下方提供了以下选项:

选择占优

根据模型拟合准则的组合,选择优于或等同于其他所有模型的每个模型。这也称为选择 Pareto 边界。对于连续响应,在确定占优模型时考虑了“R 方”和“频数总和”。对于分类响应,在确定占优模型时考虑了“熵 R 方”、“误分类率”、“AUC”和“频数总和”。

运行已选定

为每个选定行运行单个模型。若在启动窗口中指定了任何类型的折叠交叉验证,则模型运行将使用与最终模型对应的折、内折和试验组合。最终模型是生成最高加权平均 R 方的模型。加权平均 R 方是训练 R 方、验证 R 方和测试 R 方(使用测试集时)的按观测数加权的平均值。通过点击“运行已选定”,将在数据表中为所需的任何折、内折和试验组合创建验证列。

保存选定的脚本

将每个选定行的模型脚本保存至脚本窗口。若在启动窗口中指定了任何类型的折叠交叉验证,则脚本中指定的验证集将使用与最终模型对应的折、内折和试验组合。最终模型是生成最高加权平均 R 方的模型。加权平均 R 方是训练 R 方、验证 R 方和测试 R 方(使用测试集时)的按观测数加权的平均值。通过点击“保存汇总选定的脚本”,将在数据表中为所请求的任何折、内折和试验组合创建验证列。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).