在本例中,将构造一个广义回归模型并使用活跃参数拟合简化模型。基于该简化模型,使用“模拟”功能探索其中一个因子包含在该模型中的可能性。
一家医药制造公司掌握有关某种药片在人体内的溶解率以及可能影响溶解率的各种因子的历史信息。溶解率低于 70 的药片被视为有缺陷。您想要了解哪些因子影响溶解率。
在本节中,您使用广义回归拟合模型。
提示:若您不想按照本节中的步骤执行,请点击 Tablet Production.jmp 数据表中广义回归脚本旁边的绿色小三角以获取该模型。
1. 选择帮助 > 样本数据文件夹,然后打开 Tablet Production.jmp。
2. 选择分析 > 拟合模型。
3. 点击溶解并点击 Y。
4. 从搅拌时间一直选择到喷嘴压力,然后点击添加。
5. 从“特质”列表中选择广义回归。
6. 点击运行。
7. 在“模型启动”面板中,选择自适应框。
8. 在“模型启动”面板中,点击执行。
图 10.13 基于自适应 Lasso 的模型
您关注的是“使用‘AICc’验证的‘正态’自适应‘Lasso’”报表中显示的参数估计值。基于非零参数估计值,该模型表明搅拌时间、筛孔尺寸、混合时间、混合速度、压缩机、涂层粘度和喷涂率均与溶解有关。
简化模型之前,确保没有在 Tablet Production.jmp 数据表中选定任何列。选定的列不会在下面的第一步中取消选择。确保未选定任何列可防止意外包含带清零项的列。
若您不想按照本节中的步骤执行,请点击 Tablet Production.jmp 数据表中广义回归简化模型脚本旁边的绿色小三角以获取简化模型。
1. 点击“使用‘AICc’验证的‘正态’自适应‘Lasso’”旁边的红色小三角,然后选择重新启动活跃集 > 使用活跃效应重新启动。
这将打开“拟合模型”窗口,其中将“参数估计值”报表中带非零系数估计值的项放入“构造模型效应”列表。响应输入为 Y。已选定“广义回归”特质。
2. 点击运行。
3. 在“模型启动”面板中,选择自适应框。
4. 在“模型启动”面板中,点击执行。
图 10.14 使用自适应 Lasso 的简化模型
请注意,混合速度估计值的置信区间(95% 下限)非常接近包含零时的置信区间。下一步,执行模拟研究,以查看混合速度包含在以下模型中的频率:若来自溶解分布的其他数据值被观测到的话。
使用以下步骤中的简化模型(图 10.14)报表。
1. 点击“使用‘AICc’验证的‘正态’自适应‘Lasso’”旁边的红色小三角,然后选择保存列 > 保存模拟公式。
这将会向 Tablet Production.jmp 数据表添加名为“溶解”模拟公式的新列。
2. (可选)在数据表列面板中,点击“溶解”模拟公式右边的加号。
图 10.15 模拟公式
对于每行,该公式都模拟在给定模型和溶解分布的前提下可能获取的一个值;估计该分布为标准差约为 1.998 的“正态”分布。
3. 点击取消。
4. 返回简化模型报表窗口。在“原始预测变量的参数估计值”报表中,右击“估计值”列并选择模拟。
确保在“换出列”列表中选定了溶解。
5. 在样本数旁边,输入 300。
对于该模拟,您要求 JMP 使用“溶解”模拟公式列用模拟值替换 300 个分析中每一个分析中的溶解列。
6. (可选)将随机种子设置为 123。
这将重现本例中的值。
图 10.16 完成的“模拟”窗口
7. 点击确定。
表的第一行包含“估计值”的初始值,并且已被排除。其余行包含模拟值。
8. 运行分布脚本。
9. 按 Ctrl 键,点击混合速度红色小三角并选择显示选项 > 定制汇总统计量。
10. 选择零值数。
11. 点击确定。
12. 滚至混合速度的“分布”报表。
图 10.17 模拟的混合速度系数估计值的直方图
“汇总统计量”报表显示对于 103/300 = 34.3% 的模拟,混合速度估计值均为零。