预测和专业建模 > K 最近邻 > “K 最近邻”报表
发布日期: 11/15/2021

Image shown here“K 最近邻”报表

“K 最近邻”报表包含用于每个响应变量的单独报表。每个响应变量报表包含有关该响应的拟合模型的信息。该信息包含一个“模型选择”报表和拟合的 k 个模型各自的汇总信息。该报表显示针对训练集的表以及针对验证集和测试集的表(若已使用验证定义这些数据集)。

“模型选择”报表基于误分类率(对于分类响应)或 RASE(对于连续响应)显示跨越 K 的解路径图。默认情况下,将滑块置于对应于最佳效果模型的 K 的值。您可以拖动滑块来更改报表中 K 的值。

报告的统计量取决于响应的建模类型。汇总表中的每行对应于 k 个最近邻所定义的模型,其中 K 的范围为 1 到您在启动窗口中为“近邻数,K”指定的值。

Image shown here连续响应

默认情况下,除了“模型选择”图之外,连续响应的报表还包含“汇总表”报表。

汇总表

用星号来标记具有最小 RASE 的 K 值所属的模型。连续响应的报表包含以下列:

K

模型中使用的最近邻的数目。K 的范围介于 1 到您在启动窗口中指定的“近邻数,K”之间。

计数

观测数。

R 方

模型的 R 方值。

RASE

模型的均方根预测误差。用星号来标记具有最小 RASE 的模型。若有多个相同的 RASE 值,具有最小 K 的模型将标记有星号。

误差平方和

模型的误差平方和。

Image shown here分类响应

默认情况下,除了“模型选择”图之外,用于分类响应的报表还包含“汇总表”、“混淆矩阵”和“马赛克图”报表。

汇总表

用星号来标记具有最小误分类率的 K 值所属的模型。分类响应的报表包含以下列:

K

模型中使用的最近邻的数目。K 的范围介于 1 到您在启动窗口中指定的“近邻数,K”之间。

计数

观测数。

误分类率

模型误分类的观测比例。该值用误分类数除以计数计算得出。用星号来标记具有最小误分类率的模型。若有多个相同的误分类率,具有最小 K 的模型将标记有星号。

误分类

模型预测有误的观测数。

混淆矩阵

默认情况下,为具有最小“误分类率”的模型显示“混淆矩阵”报表。若有多个相同的最小误分类率,则显示具有最小 K 的模型的报表。“混淆矩阵”报表包含混淆矩阵和混淆率矩阵。混淆矩阵是实际响应和预测响应的双向分类。混淆率矩阵等同于混淆矩阵,只不过其中的数字要除以行合计。若使用验证,将显示验证集和测试集的混淆矩阵和混淆率矩阵。使用“混淆矩阵”报表和误分类率来评估您的模型。

提示:若您在解路径图中更改滑块的位置,将为所选的 K 值显示一个额外的“混淆矩阵”报表。使用这一额外的报表来比较备择模型和默认最佳模型。

马赛克图

默认情况下,为具有最小误分类率的模型显示马赛克图。若有多个相同的最小误分类率,则为具有最小 K 值的模型显示马赛克图。马赛克图是一种堆叠条形图,其中每段与组的频数统计成比例。有关马赛克图的详细信息,请参见《基本分析》中的马赛克图。若您使用验证,则显示验证集和测试集的马赛克图。

提示:若您在解路径图中更改滑块的位置,将更新马赛克图以便为所选的 K 值显示结果。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).