Liver Cancer.jmp 样本数据表包含 136 名患者的肝癌结节计数值。它还包含以下 6 个有可能相关的变量的测量值:BMI年龄时间标记肝炎黄疸。数据表的“列注释”中对这些列进行了说明。
本例使用 6 个预测变量构建结节计数的预测模型。使用 Poisson 分布对结节计数建模。
1.
选择帮助 > 样本数据库,然后打开 Liver Cancer.jmp
2.
选择分析 > 拟合模型
3.
从“选择列”列表中选择结节计数,然后点击 Y
4.
BMI 一直选到黄疸,然后点击宏 > 析因次数
这会将最高达到 2 次(次数框中的默认值)的所有项都添加到模型中。
5.
从“选择列”列表中选择验证,然后点击验证
6.
8.
点击运行
9.
点击执行
“解路径”如突出显示了非零项的 Lasso 拟合的解路径所示。 突出显示具有非零系数的项的路径。想象一下解路径在图上从右向左移动,解在逐渐远离 MLE 的位置收缩。很多项具有很早就收缩到零的路径。
突出显示了非零项的 Lasso 拟合的解路径
“原始预测变量的参数估计值”报表(突出显示非零项的参数估计值报表)显示非中心化和未统一尺度的数据的参数估计值。突出显示具有非零参数估计值的 11 项。其中包括交互作用效应。在数据表中,选择全部 6 个预测变量列,因为每个预测变量列显示在具有非零系数的项中。
11.
在“原始预测变量的参数估计值”报表中,点击 (年龄 - 56.3994)*标记[0] 所对应的行。
突出显示非零项的参数估计值报表
12.
以下两列添加到数据表:“结节计数”预测公式“结节计数”方差
13.
右击列标题并选择公式以查看公式。或者,点击“列”面板中列名称右侧的加号。
保存预测公式列中的预测公式将指数函数应用到模型的估计线性部分。使用相同公式给出“结节计数”方差中的预测方差公式,因为 Poisson 分布的方差等于其均值。