基本分析 > Bootstrapping > Bootstrapping 概述
发布日期: 08/07/2020

Bootstrapping 概述

Bootstrapping 对您报表中使用的观测反复再抽样,以便构造一个或多个统计量的分布的估计值。假定这些观测均为独立观测。

在简单 bootstrap 中,对 n 个观测进行放回再抽样,以生成大小为 n 的 bootstrap 样本。请注意,某些观测可能不出现在 bootstrap 样本中,而其他观测则可能多次出现。某个观测出现在 bootstrap 样本中的次数被称为它的 bootstrap 权重。对于每次 bootstrap 迭代,生成相关统计量的整个分析将使用以下更改重新运行:

包含 n 个观测的 bootstrap 样本是数据集

bootstrap 权重是分析平台中的频数变量

将重复执行该过程以生成一个或多个关注的统计量的值分布。

不过,简单 bootstrap 有时可能有不足之处。例如,假定您的数据集较小或是您在 Logistic 回归设置中可能遇到分离问题。在这些情况下,JMP 支持您使用分式权重执行 Bayes bootstrapping。在使用分式权重时,每个观测都关联一个分式权重。各个分式权重加总为 n。通过将分式权重视为分析平台中的频数变量来计算相关统计量。有关分式权重的信息,请参见分式权重计算分式权重

要运行报表中的 bootstrap 分析,请右击包含您要 bootstrap 的统计量的表列,然后选择“Bootstrap”。

注意:只有在报表中右击时,Bootstrap 才可用。这不是一个平台命令。

JMP 在许多统计平台上都提供 bootstrapping。有关完整列表,请参见Bootstrapping 的可用性。构成样本的观测即用在相关统计量计算中的所有观测。若报表使用频数列,该列中的观测将被视为就像是被重复了“频数”变量所指示的次数一样。若报表使用“权重”变量,则 Bootstrap 会像在报表计算中对待“权重”变量一样对待该变量。

提示:Bootstrap 重新运行在调用 Bootstrap 的平台报表中显示的整个分析。报表中的额外分析可能会导致针对您选定的列的 Bootstrap 运行较慢。若 Bootstrap 运行较慢,请先从平台报表中删除额外选项,然后再运行 Bootstrap。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).