“K 最近邻”报表的“模型拟合”部分包含以下红色小三角菜单选项:
马赛克图
(仅适用于名义型或有序型响应。)显示或隐藏马赛克图。请参见马赛克图。
标绘“预测值-实际值”图
(仅可用于连续响应。)针对具有最小 RASE 的模型标绘预测响应-实际值的图。若有多个相同的最小 RASE,则该图的绘制基于具有最小 K 的模型。
提示:若您将解路径图上的滑块位置更改为另一个 K,将更新“预测值-实际值”图以反映对应所选的 K 值的模型。
标绘“预测值-残差”图
(仅可用于连续响应。)针对具有最小 RASE 的模型标绘预测响应-实际值的图。若有多个相同的最小 RASE,则该图的绘制基于具有最小 K 的模型。
提示:若您将解路径图上的滑块位置更改为另一个 K,将更新“预测值-残差”图以反映对应所选的 K 值的模型。
保存预测值
用于将 K 个预测值列保存至数据表。这些列的名称为预测值: <响应> <k>。第 k 个列包含基于 k 个最近邻的模型的预测,其中响应是响应列的名称。平台中显示的报表统计量是使用这些原始预测生成的。
保存预测公式
用于保存包含特定 k 最近邻模型的预测公式的列。在出现提示时输入 K 的值。预测公式包含所有训练数据,所以该选项可能对大型数据表不实用。该选项适用于对新观测进行评分或预测缺失响应值。
警告:从“保存预测公式”和“保存预测值”获得的训练数据行的预测值不匹配。从“保存预测公式”选项获得的预测值使用训练集中的所有行,包括预测值所在的行。从“保存预测值”选项获得的预测值不使用训练集中预测值所在的行,仅使用其他所有行。由于“保存预测公式”选项使用所有训练数据,因此每个训练数据行都将该行本身用作第一个邻居,并具有对 k = 1 的完美预测。这意味着对训练数据的任何预测都可能过于准确;若用于计算模型统计数据,则会产生模型精度的夸大估计。因此,不会使用来自预测公式的预测来生成平台中显示的报表统计信息。
发布预测公式
为指定的 k 最近邻模型创建预测公式,并将其另存为“公式存储库”平台中的公式列脚本。若未打开“公式存储库”报表,该选项将创建“公式存储库”报表。请参见“公式存储库”。