どちらのプロットも、横軸は、尺度化したパラメータ推定値の絶対値の和です。これは、パラメータ推定値のl1ノルムです (なお、切片、過分散パラメータ、およびゼロ強調パラメータは、このl1ノルムの計算からは除外されています。)次の点に留意してください。
•
|
l1ノルムが大きい推定値は、最尤推定値に近くなります。
|
•
|
l1ノルムが小さい推定値は、大きな罰則が課されています。
|
•
|
どちらのプロットでも、「元の説明変数に対する推定値」レポートに表示された解におけるl1ノルムの1つに対して赤い縦の実線が引かれています。いずれかのプロットにおいても、赤い縦線の上部にある矢印をドラッグすると、ペナルティの値が変更され、別のペナルティに対応したモデルの結果に変更されます。検証プロットでは、任意の場所をクリックしてもモデルは変更されます。これらの操作を行うと、レポートのすべての結果が、現在選択されているモデルに合わせて更新されます。この時、縦の点線は、検証結果が最良のモデルに置かれたままです。検証プロットの横の[解をリセット]ボタンをクリックすると、赤い垂直線が最初の位置に戻り、最初に表示された結果に戻ります。一部の検証法では、検証プロットに同等なモデルを特定するゾーンが表示されます。第 “同等なモデルのゾーン”を参照してください。
「パラメータ推定値の経路」のいずれかのプロットで三角印を動かすと解が変更できますが、それらの解には内部でID番号が割り当てられます。三角印を動かして最初に表示されたものとは別の解を選択した後、[スクリプトの保存]オプションでスクリプトを保存すると、そのスクリプトには解のID番号も保存されています。この解のID番号は、 Set Solution ID( N )コマン ドというコマンドで保存されます。このように解のID番号が保存されるので、保存したスクリプトを実行すると、選択した解を再現できます。
検証プロットは、「尺度化したパラメータ推定値の絶対値の和」 (これは調整パラメータを特定の値に設定したときの推定結果から計算されます)に対してモデルの適合度を表した統計量をプロットしたものです。プロットされる適合度統計量は、選択した「検証法」によって異なります。推定法と、検証に用いる統計量、ゾーンは、各検証法でプロットされる統計量のリストです。どの検証法でも、値は小さい方が良いモデルを示します。[K分割]と[1つ取って置き法]と、値が4つ以上ある検証列の場合には、「尺度化した負の対数尤度」を、すべての分割で平均した値がプロットされます。
推定法と、検証に用いる統計量、ゾーンの[尺度化した負の対数尤度](scaled –log likelihood)とは、負の対数尤度を標本サイズで割ったものです。
尺度化した負の対数尤度をk個の検証セットのそれぞれから計算し、それを平均したもの
|
||
「検証」列の値(K)が4以上の場合
|
尺度化した負の対数尤度をk個の検証セットのそれぞれから計算し、それを平均したもの
|
最良のモデルを選んだ場合、その選択には不確定性があります。最良ではないモデルであっても、適合度がほぼ同等であれば、有益な情報が含まれているでしょう。[AICc]、[BIC]、[K分割]、[1つ取って置き法]の検証法と、値が4つ以上ある検証列の場合、「検証」プロットには、検討の余地があるモデルを特定するためのゾーンが表示されます。ゾーンの外にあるモデルは、推奨されないモデルです。Burnham and Anderson(2004)とBurnham et al.(2011)を参照してください。
ゾーンは、検証に用いた統計量に対する範囲を示します。ゾーンは、緑色や黄色に塗られています。検証に用いた統計量がゾーン内にあるとき、そのモデルはそのゾーン内に位置することを意味します。赤い縦の実線をドラッグすることにより、ゾーン内において解がどのように変化するかを調べることができます。第 “現在のモデルを示す縦線”を参照してください。
「Diabetes.jmp」で[Lasso]推定法と[AICc]検証法を選択したときの検証プロット は、「Diabetes.jmp」の検証プロットにおける2つのゾーンです(見やすくするために縦軸方向を拡大しています)。
•
|
•
|
これらの検証法では、以下の2つのゾーンによってモデルが適切であろう領域が表されています。これらの検証法では、各検証セットに対し、尺度化した負の対数尤度が計算されます。それらの標準誤差をLSEとします。また、最良のモデルにおける尺度化した負の対数尤度をLbestとします。
•
|
•
|