预测和专业建模 > K 最近邻 > 启动“K 最近邻”平台
发布日期: 09/18/2023

Image shown here启动“K 最近邻”平台

通过选择分析 > 预测建模 > K 最近邻启动“K 最近邻”平台。

图 7.4 “K 最近邻”启动窗口 

K Nearest Neighbors Launch Window

有关“选择列”红色小三角菜单中选项的详细信息,请参见《使用 JMP》中的““列过滤器”菜单”

“K 最近邻”启动窗口提供以下选项:

Y,响应

您想要分析的一个或多个响应变量。

注意:即使不存在响应变量,“K 最近邻”平台也可用作确定相邻观测之间距离的实用工具。若未指定响应变量,则会出现空白报表。不过,可以使用红色小三角菜单选项“保存近邻行”和“保存近邻距离”。

X,因子

预测变量。

验证

用于定义验证集的数值列。该列应包含至多三个非重复值。

若验证列有两个水平,则较小的值定义训练集,较大的值定义验证集。

若验证列包含三个水平,将按值由小到大的顺序相应定义训练集、验证集和测试集。

若验证列有三个以上的水平,则包含最小三个值的行定义验证集。其他所有行都从分析中排除。

“K 最近邻”平台使用验证列来训练和调优模型,或者训练、调优和评估模型。有关验证的详细信息,请参见“JMP 建模中的验证”

若在“选择列”列表中没有选择任何列的情况下点击“验证”按钮,您可以向数据表添加一个验证列。有关“生成验证列”实用工具的详细信息,请参见“生成验证列”

依据

一个或多个列,其水平定义不同的分析。对于指定列的每个水平,都使用您已经指定的其他变量分析相应行。结果显示在不同的报表中。若指定了多个“依据”变量,将为“依据”变量水平的每种可能组合生成单独的报表。

验证部分

要用作验证集的数据部分。

近邻数,K

要分析的最大最近邻数目。针对一个最近邻拟合模型,直到你指定的K值为止。

注意:最大近邻数 K 比训练数据表中的行数大不能超过 1。若指定的 K 大于允许的最大 K,则会显示警告。

类别偏倚

指定一个确保分类响应的拟合概率始终为正的调节参数。偏倚值的一部分被添加到观测计数中,以确保绝对没有零计数。该过程避免计算零的对数,这样即可确保拟合概率始终为正。“类别偏倚”值必须介于 0 到 1 之间。默认值为 0.5。

设置随机种子

设置随机化过程的种子,用于断开名义型响应和有序型响应的结值。若您指定“验证部分”,该选项还设置用于验证的行的种子。若您要重现分析,“设置随机种子”很有用。若您设置一个随机种子并保存脚本,该种子将自动保存在脚本中。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).