Arrhythmia.jmp 样本数据表包含来自 452 位患者的心电图 (ECG) 信息。最初收集数据是为了将不同模式的 ECG 归类为心率不齐。不过,该数据表中有缺失值。您主要关注的是探索这些缺失值并在必要时进行插补。由于您仅为建模类型为“连续”的列执行了缺失值插补,所以您需要在两个阶段中执行分析。
1.
|
2.
|
选择分析 > 筛选 > 探索缺失值。
|
3.
|
选择所有列(共计 280 个)并点击 Y,列。
|
4.
|
图 3.11 “缺失值”报表
图 3.11中所示的“缺失列”报表指示只有五列有缺失数据。在总共 452 行中,列 J 有 376 个缺失值。由于该列的大部分缺失,所以即便有插补值也对数据分析无益。不过,也可能在以下情况下有用:在支持“信息性缺失”选项的平台中使用该选项对列 J 建模以查看值是否可能不是随机缺失的。
包含缺失值的五列是连续列。您继续使用针对数据表中的连续列的多元插补来插补除列 J 外的四列的值。通过这样操作,您默认假定:值缺失的概率仅依赖于连续变量的值而不依赖于排除的名义型变量的值。要执行这个新分析,您需要再次启动“探索缺失值”实用工具。
1.
|
选择分析 > 筛选 > 探索缺失值。
|
2.
|
在启动窗口中,点击 280 列旁边的红色小三角。
|
3.
|
4.
|
5.
|
6.
|
点击确定。
|
7.
|
点击多元正态插补。
|
8.
|
点击是,收缩。
|
随即显示一条 JMP 警示,提醒您应该使用另存为命令保留原始数据。
9.
|
点击确定。
|
图 3.12 插补报表
图 3.12中的插补报表指示插补了多少缺失值以及具体的插补详细信息。曾经包含缺失值的四列中不再留有任何缺失数据。