公開日: 09/19/2023

ブートストラップの概要

ブートストラップでは、得られたデータから何度も復元抽出することにより、統計量の分布を求めます。なお、JMPのブートストラップでは、「データの各行は互いに独立である」と仮定します。

単純なブートストラップでは、標本サイズがnである元データから、標本サイズがnであるブートストラップ標本が復元抽出されます。このブートストラップ標本には、同じデータ行が重複して抽出されたり、逆に、抽出されないデータ行があったりすることに注意してください。ブートストラップ標本において、同じデータ行が重複している回数を、「ブートストラップの重み」と呼びます。ブートストラップにおける反復ごとに、以下のような情報が求められ、分析全体が再実行され、統計量が再計算されます。

• ブートストラップの標本（n個のオブザベーションから成るデータセット）

• ブートストラップの重み（分析プラットフォームの度数変数）

上記の計算を反復して、目的の統計量の分布を求めます。

ただし、単純なブートストラップが適切でない状況もあります。たとえば、データセットが小さかったり、ロジスティック回帰で分離の問題があったりする場合などです。このような場合に対して、JMPでは、ベイズ流のブートストラップ（Bayesian bootstrap）も用意されています。ベイズ流のブートストラップでは、重みが小数点以下を含むものになっています。この小数の重みは、合計するとnになります。この小数の重みを、各分析用のプラットフォームで度数変数として用いることにより、目的の統計量の分布を求めることができます。小数の重みについての詳細は、小数の重みおよび「小数の重み」の統計的詳細を参照してください。

目的の統計量に対してブートストラップを適用するには、結果の表から統計量の列を選択し、［ブートストラップ］を選択します。

メモ: ［ブートストラップ］オプションは、通常の赤い三角ボタンのコマンドではなく、レポートの表を右クリック（コンテキストクリック）すると呼び出されるメニューに用意されています。

JMPでは、多くの統計プラットフォームでブートストラップを使用できます。ブートストラップを使用できるプラットフォームのリストについては、ブートストラップを利用できるJMPプラットフォームを参照してください。目的の統計量を計算するのに使われたデータから、標本抽出が行われます。なお、分析するときに「度数」の列が用いられている場合には、各オブザベーションはその度数だけ繰り返し発生しているものとして処理されます。また、分析するときに「重み」の列が用いられている場合には、ブートストラップにも、その重みが反映されます。

ヒント: ブートストラップを実行すると、元のレポートに表示されているすべての分析が、再実行されます。そのため、特定の列を選択してブートストラップを行っても、すべての分析が再実行されるために、時間がかかる場合があります。処理に時間がかかる場合は、プラットフォームのレポートから、無関係なオプションを除いてください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).