通过选择分析 > 预测建模 > K 最近邻启动“K 最近邻”平台。
图 7.4 “K 最近邻”启动窗口
有关“选择列”红色小三角菜单中选项的详细信息,请参见《使用 JMP》中的“列过滤器”菜单。
“K 最近邻”启动窗口提供以下选项:
Y,响应
您想要分析的一个或多个响应变量。
注意:即使不存在响应变量,“K 最近邻”平台也可用作确定相邻观测之间距离的实用工具。若未指定响应变量,则会出现空白报表。不过,可以使用红色小三角菜单选项“保存近邻行”和“保存近邻距离”。
X,因子
预测变量。
验证
最多包含三个非重复值的数值列。请参见验证。
依据
一个或多个列,其水平定义不同的分析。对于指定列的每个水平,都使用您已经指定的其他变量分析相应行。结果显示在单独的报表中。若指定了多个“依据”变量,将为“依据”变量水平的每种可能组合生成单独的报表。
验证部分
要用作验证集的数据部分。请参见验证。
近邻数,K
要分析的最大最近邻数目。针对一个最近邻拟合模型,最多可使用您为 K 指定的值进行拟合。
注意:最大近邻数 K 不能比训练数据表中的行数少 1 大。若指定的 K 大于允许的最大 K,则会显示警告。
设置随机种子
设置随机化过程的种子,用于断开名义型响应和有序型响应的结值。若您指定“验证部分”,该选项还设置用于验证的行的种子。若您要重现分析,“设置随机种子”很有用。若您设置一个随机种子并保存脚本,该种子将自动保存在脚本中。