样本数据表 Ship Damage.JMP 改编自 McCullagh and Nelder (1989) 中的数据。该数据表包含有关波浪对船体前部造成的某类损坏的信息。船体建造工程师想了解与以下三个变量关联的损坏风险:船种类(种类)、造船的年份(制造年份)和船投入使用的年份(投入使用年份)。
在这个分析中,我们使用变量服役期(投入使用总月数的对数)作为偏移变量。将偏移变量作为其参数固定为 1.0 的回归协变量处理。偏移变量最常用于在对数连结的 Poisson 回归情形中对均值建模统一尺度。在本例中,我们使用 log(服役月数),因为工程师期望维修次数与投入使用的月数成比例。
为了了解如何使用偏移变量,假定 GLM 的线性成分称为 η。然后使用对数连结函数,带有偏移均值的模型如下所示:
exp[Log(服役月数) + η] = [(服役月数) * exp(η)].
要运行该示例,请执行以下步骤:
1. 选择帮助 > 样本数据库,然后打开 Ship Damage.jmp。
2. 选择分析 > 拟合模型。
3. 从“特质”列表中选择广义线性模型。
4. 从“分布”列表中选择 Poisson。
在“连结函数”列表中,应自动为您选择对数。
5. 选择 N 并点击 Y。
6. 选择服役期并点击偏移。
7. 选择种类、制造年份、投入使用年份并点击添加。
8. 点击过度离散检验和区间的复选标记框。
9. 点击运行。
从该报表中,我们看到三个效应(种类、制造年份、投入使用年份)都是显著的。
图 12.7 具有偏移的 Poisson 模型的部分报表