1.
|
2.
|
选择分析 > 预测建模 > K 最近邻。
|
3.
|
4.
|
由于其中一个潜在预测变量负债收入比有很多缺失值,所以您没有将其包含在模型内。连续预测变量的缺失值用该预测变量的平均值替代。该过程对于随机缺失的值很有效。负债收入比的高缺失率指示缺失可能是信息性的,但是我们在本例中不调查它。
5.
|
6.
|
点击确定。
|
图 8.2 “K 最近邻”报表
对于 K 的每个值,JMP 仅使用训练集观测构造模型。这些模型均用于对验证集观测分类。使用验证集结果来选择最佳模型。在本例中,基于单个最近邻 (K = 1) 的模型的误分类率最小。测试集确认这一单个最近邻模型对于独立数据的效果最佳。
7.
|
8.
|
在近邻数,K 旁边,保留默认值 1。
|
9.
|
点击确定。
|