K分割交差検証法は、元のデータをk個にランダムに分割します。k個のデータはそれぞれ順番に検証セットとして使われ、残りのデータセットは学習セットとしてモデルをあてはめるのに使用されます。合計で、k個のモデルがあてはめられ、k個の検証結果が得られます。検証セットから計算された統計量が最良のものが、最終的なモデルとして選ばれます。この方法は、少ないデータを効率的に利用するので、小規模なデータセットに適しています。
メモ: K分割交差検証は、応答変数が連続尺度である場合のみ使用できます。
JMPの場合は、「ステップワイズ」のタイトルバーにある赤い三角ボタンをクリックし、[K分割交差検証]を選択します。
JMP Proの場合は、次の2通りの方法でK分割交差検証を実行できます。
• 「ステップワイズ」のタイトルバーにある赤い三角ボタンをクリックし、[K分割交差検証]を選択する。
• 異なる値が4つ以上ある検証列を指定する。
K分割交差検証を実行すると、「ステップワイズ回帰の設定」パネルのその他の統計量の右側に「R2乗 K分割」統計量が表示されます。この「R2乗 K分割」は、k個の「R2乗 検証」を平均した値です。
K分割交差検証を使用する場合、「停止ルール」のデフォルトが[最大K分割R2乗]に切り替わります。このルールは、「R2乗 K分割」統計量を最大化しようと試みます。
メモ: [最大K分割R2乗]は、p値に基づく変数の追加(変数増加)または削除(変数減少)によってあてはめられていったモデルだけを検討し、考えられるすべてのモデルを検討するわけではありません。
[最大K分割R2乗]の停止ルールは、[最大検証R2乗]のときと同じように動作します。最大検証R2乗を参照してください。そこに書かれている「R2乗 検証」を「R2乗 K分割」と読み換えてください。