预测和专业建模 > K 最近邻 > 包含分类响应的 K 最近邻的示例
发布日期: 09/18/2023

Image shown here包含分类响应的 K 最近邻的示例

在本例中,您需要构造一个模型来对申请房屋净值贷款的客户的信用风险进行分类。您有 5960 位客户的历史财务数据,每位客户都被归入“良性风险”或“不良风险”两类。很多预测变量有缺失值。

1. 选择帮助 > 样本数据文件夹,然后打开 Equity.jmp

2. 选择分析 > 预测建模 > K 最近邻

3. 选择不良并点击 Y,响应

4. 贷款一直选到交易记录数,然后点击 X,因子

由于其中一个潜在预测变量负债收入比有很多缺失值,所以您没有将其包含在模型内。连续预测变量的缺失值用该预测变量的平均值替代。该过程有时对于随机缺失的值很有效。尽管负债收入比的高缺失率指示缺失可能是信息性的,但是我们在本例中不调查它。

5. 选择验证并点击验证

6. 点击确定

图 7.2 “K 最近邻”报表 

K Nearest Neighbors Report

对于 K 的每个值,JMP 仅使用训练集观测来构造模型。这些模型均用于对验证集观测分类。使用验证集结果来选择最佳模型。在本例中,基于单个最近邻 (K = 1) 的模型的误分类率最小。测试集确认这一单个最近邻模型对于独立数据的效果最佳。

7. 点击不良红色小三角并选择发布预测公式

8. 近邻数,K 旁边,保留默认值 1。

9. 点击确定

预测方程保存在“公式存储库”中。您可以使用“公式存储库”中的“模型比较”选项比较发布到“公式存储库”中的备择模型和 K = 1 最近邻模型的效果。请参见“公式存储库”

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).