随机效应具有双重特征。其中一个特征就是它们代表剩余误差,比如与整区实验单元关联的误差。另一个特征则是:和固定效应一样,随机效应的每个水平都关联一个参数。您掌握关于参数的额外信息,这些参数来自具有 0 均值和方差分量估计的方差的正态分布。该额外信息的影响在于:参数的估计值朝着 0 收缩。
与随机效应关联的参数估计值称为 BLUP(最佳线性无偏预测变量)。某些研究人员将这些 BLUP 视为关注的参数,而其他研究人员则将其视为该方法的无关副产品。
BLUP 参数估计值用来估计随机效应的最小二乘均值,因此它们也朝着总均值收缩。收缩度取决于效应方差和效应中每个水平的观测数。对于较大的方差估计值,收缩很小。若方差分量较小,则会出现较多的收缩。若方差分量为 0,效应水平将收缩到恰好为 0。甚至还有可能获得很大的负方差分量,此时的收缩已反转。您可以将固定效应视为随机效应的特例,这种情况下的方差分量非常大。
REML 方法可将每一单个水平的信息与水平间方差的信息进行平衡。若每个水平的观测数较大,则估计值收缩较小。若每个水平的观测数极少,则估计值收缩较大。若有无穷多的观测,则无收缩,估计值与固定效应相同。
假定您有不同棒球选手的击球平均值。不同选手击球表现的方差分量描述不同选手之间在击球平均值上有多大的变异是典型的。假定某个选手只击球几次,并且击球平均值异常小或异常大。那么您往往不会相信该估计值,因为该值基于的打数很少。但若您将该估计值与总均值混合,即:朝着总均值收缩该估计值,那么您会较为信任该估计值。对于有着较长击球记录的选手而言,其收缩比记录较短的选手的收缩要小得多。
您可以自行探索该行为。
1. 选择帮助 > 样本数据库,然后打开 Baseball.jmp。
2. 选择分析 > 拟合模型。
3. 选择击球,然后点击 Y,响应。
4. 选择选手,然后点击添加。
5. 选择“构造模型效应”框中的“选手”,然后从“特性”列表中选择随机效应。
6. 点击运行。
表 4.3 显示使用“REML(推荐)”拟合时“选手”报表中的“最小二乘均值”。同时显示的还有使用 EMS 方法获取的“矩量法”估计值。“矩量法”估计值是普通的选手均值。请注意,与有更多打数的其他选手的 REML 估计值相比,仅有三次打数的 Suarez 的 REML 估计值朝着总均值收缩的幅度更大。
|
矩量法 |
REML |
数目 |
---|---|---|---|
方差分量 |
0.01765 |
0.019648 |
|
Anderson Jones Mitchell Rodriguez Smith Suarez |
0.29500000 0.20227273 0.32333333 0.55000000 0.35681818 0.55000000 |
0.29640407 0.20389793 0.32426295 0.54713393 0.35702094 0.54436227 |
6 11 6 6 11 3 |
最小二乘均值 |
与普通均值相同 |
从均值收缩 |
|