本例演示针对一个小型数据表的“分式权重”(Bayes Bootstrap) 选项的优点。数据中包含一个响应 Y,该响应是针对七种不同土壤类型中的每一种的三个样本测量的结果。一位科学家想要查明 wabash 土壤类型的响应均值的置信区间。
由于每种土壤类型仅有三个观测,简单 bootstrap 有可能从 bootstrap 样本中排除全部三个 wabash 观测。而“分式权重”选项可确保在所有 bootstrap 样本中都能表示每种土壤类型的所有观测。
这位科学家检查了使用两种 bootstrap 方法得到的 wabash 样本均值的分布:
1.
|
2.
|
选择分析 > 以 X 拟合 Y。
|
3.
|
4.
|
5.
|
点击确定。
|
6.
|
从“单因子分析”红色小三角菜单中选择均值/方差分析。
|
7.
|
8.
|
键入 1000 作为 Bootstrap 样本数的值。
|
9.
|
10.
|
点击确定。
|
简单 Bootstrap 的 Bootstrap 结果中的缺失值表示 bootstrap 迭代,在这些迭代中,给定土壤类型的所有观测都未选定用于 bootstrap 样本。
11.
|
选择分析 > 分布。
|
12.
|
13.
|
点击确定。
|
简单 Bootstrap 的 wabash 均值分布显示来自简单 bootstrap 分析的 wabash 均值的分布。请注意以下情况:
‒
|
“汇总统计量”报表指示包含 wabash 的 bootstrap 均值的行数为 N = 961。尽管您执行了 1,000 次迭代,有 39 个 bootstrap 样本未包含 wabash 三个观测中的任何一个观测。
|
‒
|
样本均值的直方图不平滑,在两个极值处出现了峰值。wabash 的三个值为 38.2、37.8 和 31.9。分布低端出现的峰值来自仅包含值 31.9 的 bootstrap 样本。高端出现的峰值来自包含 38.2 和 37.8 中的一个或两个值的 bootstrap 样本。
|
1.
|
2.
|
键入 1000 作为 Bootstrap 样本数的值。
|
3.
|
4.
|
选择分式权重选项。
|
5.
|
点击确定。
|
Bayes Bootstrap 结果表中没有缺失值。每个 bootstrap 样本中都包含 Snapdragon.jmp 数据表中的全部 21 行,这些行的 bootstrap 权重各异。
6.
|
选择分析 > 分布。
|
7.
|
8.
|
点击确定。
|
Bayes Bootstrap 为 wabash 样本均值生成了平滑得多的分布。全部 1,000 个 bootstrap 样本都包含 wabash 的三个观测。对于每次迭代,wabash 样本均值都使用不同的分式权重计算。