“K 最近邻”报表包含用于每个响应变量的单独报表。每个响应变量报表包含有关该响应的拟合模型的信息。该信息包含一个“模型选择”报表和拟合的 k 个模型各自的汇总信息。该报表显示针对训练集的表以及针对验证集和测试集的表(若已使用验证定义这些数据集)。
“模型选择”报表基于误分类率(对于分类响应)或 RASE(对于连续响应)显示跨越 K 的解路径图。默认情况下,将滑块置于对应于最佳效果模型的 K 的值。您可以拖动滑块来更改报表中 K 的值。
报告的统计量取决于响应的建模类型。汇总表中的每行对应于 k 个最近邻所定义的模型,其中 K 的范围为 1 到您在启动窗口中为“近邻数,K”指定的值。
默认情况下,除了“模型选择”图之外,连续响应的“K 最近邻”报表还包含一个汇总表。
用星号来标记具有最小 RASE 的 K 值所属的模型。连续响应的报表包含以下列:
K
模型中使用的最近邻的数目。K 的范围介于 1 到您在启动窗口中指定的“近邻数,K”之间。
计数
观测数。
R 方
模型的 R 方值。
RASE
模型的均方根预测误差。用星号来标记具有最小 RASE 的模型。若有多个相同的 RASE 值,具有最小 K 的模型将标记有星号。
误差平方和
模型的误差平方和。
默认情况下,除了“模型选择”图之外,分类响应的“K 最近邻”报表还包含一个汇总表、一个混淆矩阵和一个马赛克图。
用星号来标记具有最小误分类率的 K 值所属的模型。分类响应的报表包含以下列:
K
模型中使用的最近邻的数目。K 的范围介于 1 到您在启动窗口中指定的“近邻数,K”之间。
计数
观测数。
R 方
模型的“熵 R 方”。
误分类率
模型误分类的观测比例。该值用误分类数除以计数计算得出。用星号来标记具有最小误分类率的模型。若有多个相同的误分类率,具有最小 K 的模型将标记有星号。
误分类
模型预测有误的观测数。
默认情况下,为具有最小“误分类率”的模型显示“混淆矩阵”报表。若有多个相同的最小误分类率,则显示具有最小 K 的模型的报表。“混淆矩阵”报表包含混淆矩阵和混淆率矩阵。混淆矩阵是实际响应和预测响应的双向分类。混淆率矩阵等同于混淆矩阵,只不过其中的数字要除以行合计。若使用验证,将显示验证集和测试集的混淆矩阵和混淆率矩阵。使用“混淆矩阵”报表和误分类率来评估您的模型。
提示:若您在解路径图中更改滑块的位置,将为所选的 K 值显示一个额外的“混淆矩阵”报表。使用这一额外的报表来比较备择模型和默认最佳模型。
默认情况下,为具有最小误分类率的模型显示马赛克图。若有多个相同的最小误分类率,则为具有最小 K 值的模型显示马赛克图。马赛克图是一种堆叠条形图,其中每段与组的频数统计成比例。有关马赛克图的详细信息,请参见《基本分析》中的“马赛克图”。若您使用验证,则显示验证集和测试集的马赛克图。
提示:若您在解路径图中更改滑块的位置,将更新马赛克图以便为所选的 K 值显示结果。