创建数据分割的一种方式就是使用“验证列”角色。“验证列”角色使用该列的值将数据划分为多个部分。使用平台启动窗口中的“验证”角色分配该列。有关如何创建验证列的信息,请参见“生成验证列”。
仅在 JMP Pro 中提供“验证列”角色。对于 JMP,请参见排除行作为验证保留。
警告:验证列的用法是特定于平台的。不同平台对验证列水平的使用方式有所不同。请参见表 A.1 中的注释。
表 A.1 按平台划分的验证列
平台 |
训练和评估 |
训练和调优 |
训练、调优和评估 |
注意 |
---|---|---|---|---|
拟合模型 |
|
|
|
|
拟合最小二乘法 |
是 |
否 |
否 |
若有三个以上水平,则忽略验证列。 |
逐步回归 |
否 |
是 |
是 |
若有三个以上水平,则使用“K 折交叉验证”。 |
Logistic 回归 |
是 |
否 |
否 |
若有三个以上水平,则忽略验证列。 |
广义回归 |
否 |
是 |
是 |
若有三个以上水平,则使用“K 折交叉验证”。 |
偏最小二乘 |
否 |
是 |
是 |
若有三个以上水平,则使用“K 折交叉验证”。 |
预测模型 |
|
|
|
|
神经 |
否 |
是 |
是 |
若有三个以上水平,则使用“K 折交叉验证”。 |
分割 |
否 |
是 |
是 |
若有三个以上水平,则平台仅使用具有三个最小值的行。 |
Bootstrap 森林法 |
否 |
是 |
是 |
若有三个以上水平,则平台仅使用具有三个最小值的行。 |
提升树 |
否 |
是 |
是 |
若有三个以上水平,则平台仅使用具有三个最小值的行。 |
K 最近邻 |
否 |
是 |
是 |
若有三个以上水平,则平台仅使用具有三个最小值的行。 |
朴素 Bayes |
否 |
是 |
是 |
若有三个以上水平,则平台仅使用具有三个最小值的行。 |
支持向量机 |
是 |
是 |
是 |
若有三个以上水平,则使用“K 折交叉验证”。 |
专业模型 |
|
|
|
|
函数数据分析器 |
是 |
否 |
否 |
必须创建为“分组随机”验证列。 若有两个以上水平,则最小的值定义训练集,所有其他值定义验证集。 |
多元模型 |
|
|
|
|
判别 |
是 |
是 |
是 |
若有三个以上水平,则平台仅使用具有三个最小值的行。 |
偏最小二乘 |
否 |
是 |
是 |
若有三个以上水平,则使用“K 折交叉验证”。 |
提升 |
否 |
是 |
是 |
若有三个以上水平,则平台仅使用具有三个最小值的行。 |