「ブートストラップ森」プラットフォームの「ツリーごとの要約」レポートでは、「バッグ内(IB; In-Bag)」および「バッグ外(OOB; Out-Of-Bag)」という考えが使われています。各ツリーのあてはめでは、そのたびにデータが復元抽出されています。100%のデータが復元抽出されるように指定した場合は、1回、1回の抽出において1度も抽出されないデータの割合は約1/eとなります。各ツリーでのあてはめにおいて、これらの1度も抽出されなかったデータは「バッグ外標本」と呼ばれます。逆に、1度以上、抽出されたデータ行は「バッグ内標本(in-bag)」と呼ばれます。
「ツリーごとの要約」レポートには、各ツリーにおける以下の要約統計量が表示されます。
分岐
1つのディシジョンツリー内における分岐数。
順位
「OOB 損失」を昇順で並べた、ツリーの順位。「OOB 損失」が最も小さいツリーの順位が1位になっています。
OOB 損失
バッグ外標本から計算された、求められたディシジョンツリーの予測の不確かさを示す指標。この指標が小さいほど、予測精度が良いことを示します。
OOB 損失/N
「OOB 損失」を、「OOB N」(バッグ外標本の標本サイズ)で割った値。
R2乗
(応答が連続尺度の場合のみ。)ツリーのR2乗値。
IB SSE
(応答が連続尺度の場合のみ。)バッグ内標本から計算された誤差平方和。
IB SSE/N
(応答が連続尺度の場合のみ。)バッグ内の誤差平方和を、バッグ内の標本サイズで割ったもの。バッグ内の標本サイズは、学習セットの標本サイズに、「ブートストラップの森の指定」ウィンドウで指定したブートストラップ抽出率を掛けた値です。
OOB N
(応答が連続尺度の場合のみ。)バッグ外標本の標本サイズ。
OOB SSE
(応答が連続尺度の場合のみ。)バッグ外標本から計算された、求められたツリーの誤差平方和(SSE; Sum of Squared Errors)。
OOB SSE/N
(応答が連続尺度の場合のみ。)「OOB SSE」を「OOB N」(バッグ外標本の標本サイズ)で割った値。