Lipid Data.jmp 数据表包含来自加利福尼亚州医院 95 个研究对象的血液测量值、体格检查测量值和问卷数据。您关注的是如何在将来分析中将验证列用作验证方法。
1.
|
2.
|
选择分析 > 分布。
|
3.
|
图 3.15 Lipid Data.jmp 中性别的分布
图 3.15演示了数据集中性别的分布。请注意,表示出来的男性和女性的比例不相同。由于数据中的女性稀少,您想要平衡验证集和训练集之间的性别比例。
4.
|
选择分析 > 预测建模 > 生成验证列。
|
5.
|
点击分层随机。
|
6.
|
将性别选作用于验证保留的列。
|
7.
|
点击确定。
|
8.
|
选择分析 > 以 X 拟合 Y。
|
9.
|
10.
|
点击确定。
|
图 3.16 性别在验证集和训练集之间的分布
图 3.16演示了性别在每个验证集和训练集之间的分布。请注意,男性和女性都有大约 75% 位于训练集中,并且男性和女性都有大约 25% 位于验证集中。