Bootstrapping 对您报表中使用的观测反复再抽样,以便构造一个或多个统计量的分布的估计值。假定这些观测均为独立观测。
在简单 bootstrap 中,对 n 个观测进行放回再抽样,以生成大小为 n 的 bootstrap 样本。请注意,某些观测可能不出现在 bootstrap 样本中,而其他观测则可能多次出现。某个观测出现在 bootstrap 样本中的次数被称为它的 bootstrap 权重。对于每次 bootstrap 迭代,生成相关统计量的整个分析将使用以下更改重新运行:
• 包含 n 个观测的 bootstrap 样本是数据集
• bootstrap 权重是分析平台中的频数变量
将重复执行该过程以生成一个或多个关注的统计量的值分布。
不过,简单 bootstrap 有时可能有不足之处。例如,假定您的数据集较小或是您在 Logistic 回归设置中可能遇到分离问题。在这些情况下,JMP 支持您使用分式权重执行 Bayes bootstrapping。在使用分式权重时,每个观测都关联一个分式权重。各个分式权重加总为 n。通过将分式权重视为分析平台中的频数变量来计算相关统计量。有关分式权重的信息,请参见分式权重和计算分式权重。
要运行报表中的 bootstrap 分析,请右击包含您要 bootstrap 的统计量的表列,然后选择“Bootstrap”。
注意:只有在报表中右击时,Bootstrap 才可用。这不是一个平台命令。
JMP 在许多统计平台上都提供 bootstrapping。有关完整列表,请参见Bootstrapping 的可用性。构成样本的观测即用在相关统计量计算中的所有观测。若报表使用频数列,该列中的观测将被视为就像是被重复了“频数”变量所指示的次数一样。若报表使用“权重”变量,则 Bootstrap 会像在报表计算中对待“权重”变量一样对待该变量。
提示:Bootstrap 重新运行在调用 Bootstrap 的平台报表中显示的整个分析。报表中的额外分析可能会导致针对您选定的列的 Bootstrap 运行较慢。若 Bootstrap 运行较慢,请先从平台报表中删除额外选项,然后再运行 Bootstrap。