分层项使用类似于“分割”分析的树结构进行构造。但是,最大化的准则为组间平方和 (SSB)。
对于具有 k 个水平的名义型变量,将 k 个水平拆分为具有最大 SSB 的两组水平。将这两组水平称为 A1 和 A2,其中 A1 具有较小的均值,A2 具有较大的均值。A1 和 A2 中的两组水平用于定义一个指标变量,它对于 A1 中的水平具有值 1,对于 A2 中的水平具有值 -1。该变量是名义型变量的第一个分层项。
对于初始组 A1 和 A2 每个组中的各个水平,找到一个具有最大 SSB 的两组水平的拆分。假定具有最大 SSB 的水平组是 A1 中的水平。将这两个组称为 B1 和 B2,其中 B1 具有较小的均值,B2 具有较大的均值。B1 和 B2 中的两组水平用于定义一个分层变量,它对于 B1 中的水平具有值 1,对于 B2 中的水平具有值 -1,对于 A2 中的水平具有值 0。要构造下一个变量,请拆分 B1、B2 和 A2 中的水平。使 SSB 最大化的拆分定义下一个分层变量。继续执行该过程,直到构造了 k-1 个分层项。
对于有序型变量,在拆分中考虑的水平组仅包含在顺序中是相邻的水平。这确保构造的项遵守水平顺序。
当您使用合并规则或限制规则时,项无法进入模型,除非层次中该项上层的所有项都进入了模型。使用整体效应规则并使分类变量的项进入时,它的所有关联项也会进入。相关示例,请参见示例中分层项的构建。