公開日: 09/19/2023

ここに画像を表示ツリーごとの要約

「ブートストラップ森」プラットフォームの「ツリーごとの要約」レポートでは、「バッグ内(IB; In-Bag)」および「バッグ外(OOB; Out-Of-Bag)」という考えが使われています。各ツリーのあてはめでは、そのたびにデータが復元抽出されています。100%のデータが復元抽出されるように指定した場合は、1回、1回の抽出において1度も抽出されないデータの割合は約1/eとなります。各ツリーでのあてはめにおいて、これらの1度も抽出されなかったデータは「バッグ外標本」と呼ばれます。逆に、1度以上、抽出されたデータ行は「バッグ内標本(in-bag)」と呼ばれます。

「ツリーごとの要約」レポートには、各ツリーにおける以下の要約統計量が表示されます。

分岐

1つのディシジョンツリー内における分岐数。

順位

「OOB 損失」を昇順で並べた、ツリーの順位。「OOB 損失」が最も小さいツリーの順位が1位になっています。

OOB 損失

バッグ外標本から計算された、求められたディシジョンツリーの予測の不確かさを示す指標。この指標が小さいほど、予測精度が良いことを示します。

OOB 損失/N

「OOB 損失」を、「OOB N」(バッグ外標本の標本サイズ)で割った値。

R2乗

(応答が連続尺度の場合のみ。)ツリーのR2乗値。

IB SSE

(応答が連続尺度の場合のみ。)バッグ内標本から計算された誤差平方和。

IB SSE/N

(応答が連続尺度の場合のみ。)バッグ内の誤差平方和を、バッグ内の標本サイズで割ったもの。バッグ内の標本サイズは、学習セットの標本サイズに、「ブートストラップの森の指定」ウィンドウで指定したブートストラップ抽出率を掛けた値です。

OOB N

(応答が連続尺度の場合のみ。)バッグ外標本の標本サイズ。

OOB SSE

(応答が連続尺度の場合のみ。)バッグ外標本から計算された、求められたツリーの誤差平方和(SSE; Sum of Squared Errors)。

OOB SSE/N

(応答が連続尺度の場合のみ。)「OOB SSE」を「OOB N」(バッグ外標本の標本サイズ)で割った値。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).