传统上,逐步回归不适用于模型中有分类效应的情形。请注意以下事项:
• 回归模型包含名义型或有序型效应时,这些效应用一组指示符列表示。
• 分类效应只有两个水平时,该效应用单个列表示。
• 分类效应有 k 个水平(其中 k > 2)时,它必须用 k-1 个列表示。
JMP 中用于标准平台的惯例是使用其参数估计值在所有水平上平均为零的项表示名义型变量。
在“逐步”平台中,以分层方式对分类变量(名义型和有序型)进行编码。这与其他最小二乘法拟合平台中的编码方式不同。在分层编码中,将分类变量的水平逐个拆分为最能分隔响应均值的水平组。该拆分过程实现了用 k - 1 个项表示 k 个水平的分类变量的目标。
注意:在分层编码中,构造的初始项表示实现最大分隔的组。该编码方案的优势是这些信息性项有可能先进入模型。