公開日: 09/19/2023

「分割全体の要約」レポート

「モデルのスクリーニング」プラットフォームの「分割全体の要約」レポートには、分割全体における適合度指標の要約が表示されます。また、「反復K分割」を指定した場合には、全試行における適合度指標の要約も表示されます。[K分割交差検証]オプションを指定した場合は、適合度指標が検証セット全体について要約されます。[入れ子式交差検証]オプションを指定した場合、適合度指標がテストセット全体について要約されます。このレポートには、以下の列を含む表があります。

手法

モデルのあてはめに使用された手法の名前。

試行×分割

すべての分割と試行にわたってあてはめられたモデルの合計数(該当する場合)。

度数合計

すべての検証セットまたはテストセットにおける標本サイズ(観測数)の平均。テストセットは、モデルの予測性能を評価するのに使われます。

R2乗

すべての検証セットまたはテストセットにおけるR2乗の平均。応答がカテゴリカルな場合は、この列にエントロピーR2乗が含まれます。

平均 RASE

すべての検証セットまたはテストセットにおけるRASE(平均平方誤差の平方根)の平均。

標準偏差 RASE

すべての検証セットまたはテストセットにおけるRASE(平均平方誤差の平方根)の標準偏差。

平均 AUC

(応答がカテゴリカルな場合にのみ使用可能。)すべての検証セットまたはテストセットにおけるAUC(ROC曲線の曲線下面積)の平均。

平均 MR

(応答がカテゴリカルな場合にのみ使用可能。)すべての検証セットまたはテストセットにおける誤分類率(MR; Misclassification Rate)の平均。

表の下には以下のオプションがあります。

パレート優位を選択

モデルの適合度統計量に関して、他のすべてのモデル以上に良い各モデルを選択する。「パレート優位」は、「パレートフロンティア(パレート境界)の選択」とも呼ばれます。応答変数が連続尺度である場合は、パレート優位を決定するときに「R2乗」と「度数合計」が考慮されます。応答変数がカテゴリカルである場合は、パレート優位を決定するときに「エントロピーR2乗」・「誤分類率」・「AUC」・「度数合計」が考慮されます。

選択したモデルの実行

選択されているモデルを実行する。起動ウィンドウで任意の種類の交差検証が指定されている場合、モデルの実行では、最終モデルに対応する分割・内側分割・試行の組み合わせが使用されます。最終モデルは、重み付き平均R2乗値が最大となっているモデルです。重み付き平均R2乗値は、観測数で重み付けされた、学習R2乗・検証R2乗・テストR2乗(テストセットが使用されている場合)の平均です。[選択したモデルの実行]をクリックすると、必要とされる分割・内側分割・試行の組み合わせの検証列がデータテーブルに作成されます。

選択したモデルのスクリプトを保存

選択されているモデルのスクリプトをスクリプトウィンドウに保存する。起動ウィンドウで任意の種類の交差検証が指定されている場合、スクリプトで指定されている検証セットでは、最終モデルに対応する分割・内側分割・試行の組み合わせが使用されます。最終モデルは、重み付き平均R2乗値が最大となっているモデルです。重み付き平均R2乗値は、観測数で重み付けされた、学習R2乗・検証R2乗・テストR2乗(テストセットが使用されている場合)の平均です。[選択したモデルのスクリプトを保存]をクリックすると、必要とされる分割・内側分割・試行の組み合わせの検証列がデータテーブルに作成されます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).