「一般化回帰」の設定パネルの[詳細設定]オプションによって、推定に関する計算を調整できます。設定の多くは、調整パラメータのグリッドに関するものです。
Lassoとリッジ回帰では、パラメータ推定値の経路は、1つの調整パラメータによって決まります。弾性ネットでは、パラメータ推定値の経路は、その1つの調整パラメータに加えて、アルファというパラメータにも依存します。弾性ネットの尤度に対する罰則は、Lassoで使われる罰則項と、リッジ回帰で使われる罰則項の加重和になっています。弾性ネットのアルファは、それらの2つの罰則項に対する重みを決めます。推定法の統計的詳細および「詳細設定」の統計的詳細を参照してください。
調整パラメータがゼロの場合、罰則なしの推定が行われ、推定値は最尤推定値になります。調整パラメータが大きくなるにつれて、罰則も大きくなります。
最初に表示されている結果は、罰則を課した負の対数尤度関数を最小化するパラメータ推定値のうち、選択された検証法において最良となっている結果です。現在の解は、「パラメータ推定値の経路」プロットに赤い縦線として表示されています。
メモ: 「尺度化したパラメータ推定値の絶対値の和」が小さくなるほど、調整パラメータの値は大きくなっています。絶対値が大きい推定値は最尤推定値に近く、絶対値が小さい推定値には大きな罰則が課されています。
次の点に注意してください。
• 調整パラメータの値が小さすぎると、通常、データにオーバーフィット(過剰適合)し、その結果、ばらつき(分散)の大きいモデルになる場合があります。
• 調整パラメータの値が大きすぎると、通常、データにアンダーフィット(過少適合)します。
指定されたグリッド上にある複数の調整パラメータの値に対して、パラメータ推定値が求められていきます。
• Lasso、リッジ回帰、アルファを指定した弾性ネットでは、複数の調整パラメータ値のなかで最良のモデルのものが選択されます。
メモ: 「弾性ネットのアルファ」はデフォルトで0.99に設定されています。
• アルファに数値を設定しない場合、細かく増加させていった複数のアルファ値に対して推定が行われます。アルファの値を動かしているときには、調整パラメータの値は固定され、アルファの値だけが変更されていきます。そして、アルファに対する10回の連続する変更において、それまでで最良のモデルから改善されなかった時点でその変更が停止されます。この計算が、調整パラメータ値のグリッド全体に対して繰り返されます。最終的に選択される調整パラメータとアルファは、グリッド上の各調整パラメータ値に対してそうやって推定されたモデルのなかで、最良のものです。
使われる調整パラメータ値の範囲は、ほとんどの場合、ゼロを下限とします。また、切片以外のパラメータ推定値がゼロになる調整パラメータの最小値を、調整パラメータ値の上限に設定します。調整パラメータ値の下限は、次の2つの状況では0.0001に設定されますが、それ以外ではゼロに設定されます。
• 計画行列が特異な場合。計画行列が特異な場合には最尤推定値を計算できません。調整パラメータ値の下限を0.0001にすることで、最尤推定値に近い推定値を求めることができます。
• 応答変数の確率分布が二項分布または多項分布の場合。下限を0.0001に設定することでロジスティック回帰における分離(separation)の問題を回避できます。
親子関係を効果に必ず適用する
このオプションをオンにすると、「高次の効果を追加する場合、その効果に関連する低次の効果を先にモデルに追加しておく」という制約を課します。このオプションをオンにすると、ほとんどの場合、モデルにXがなければ、X2も含まれません。しかし変数増加法を除く推定法では、1つのステップでX2がモデルに含まれ、Xが除外されることもあります。データテーブルに「DOEスクリプト」が含まれる場合は、このオプションがデフォルトでオンになっていますが、そのほかの場合ではデフォルトではオフになっています。
弾性ネットのアルファ
弾性ネットのaパラメータを設定します。このaパラメータが、弾性ネットを推定する際のl1およびl2ペナルティに対する比重を決定します。デフォルトの値はa = 0.99で、これはl1ペナルティに対する重みを0.99、l2ペナルティに対する重みを0.01に設定します。このオプションは、「推定法」で[弾性ネット]を選択した場合にのみ使用できます。推定法の統計的詳細を参照してください。
グリッド点の個数
調整パラメータの下限と上限の間にあるグリッド点の個数。各グリッド点において、そのグリッド点に対応した調整パラメータ値のモデルが推定されます。デフォルトは150個です。
最小ペナルティ比
「調整パラメータの下限値÷調整パラメータの上限値」の最小値。これがゼロの場合は、調整パラメータ値がゼロのときの結果、つまり、最尤推定の結果が含まれます。最尤推定を含めたくない場合は、「最小ペナルティ比」に0以外の値を設定してください。ダブルLassoでは、このオプションで指定した値は、第1段階の推定でのみ使用されます。計画行列が特異である場合、デフォルト値は0.0001です。それ以外の場合、デフォルト値は0です。
グリッドスケール
グリッドにおけるスケールを選択します。スケールとして線形・平方根・自然対数のいずれかを選択できます。[グリッド点の個数]で指定した個数のグリッド点が、ここで選択したスケールに従って、調整パラメータの下限値と上限値の間に配置されます。デフォルトのスケールは平方根です。「詳細設定」の統計的詳細を参照してください。
第1段階の結果
ダブルLassoと2段階変数増加法の第1段階において、どのようにモデルを選択するかを指定します。デフォルトでは、指定された検証方法に基づいて最良と判断されたモデルが選択され、その結果が最初に表示されます([最良])。最良のモデルよりもl1ノルムがやや大きい、または、やや小さいモデルを選択することもできます。このときに選択されるモデルは、緑色や黄色のゾーンにあることが条件です。たとえば、[黄色ゾーンで最小]を選択すると、黄色ゾーンで最小のl1ノルムを持つモデルが解として選択されるようになります。同等なモデルのゾーンを参照してください。
効果の最大個数
総あたり法において考慮する効果の最大個数を指定します。小さな整数を指定することによりすることにより、モデルにあてはめるのに必要な計算量を制限できます。デフォルト値は10です。
最初に表示される結果
「パラメータ推定値の経路」レポートに最初に表示されるモデルをどのように選択するかを指定します。グラフにて、縦の実線で表されている個所が現在のモデルを示します。現在のモデルを示す縦線を参照してください。最良のモデルは、縦の点線として表示されます。デフォルトでは、指定された検証方法に基づいて最良と判断されたモデルが選択されます。
最良のモデルよりもl1ノルムがやや大きい、または、やや小さいモデルを選択することもできます。このときに選択されるモデルは、緑色や黄色のゾーンにあることが条件です。たとえば、[黄色ゾーンで最小]を選択すると、黄色ゾーンで最小のl1ノルムを持つモデルが解として選択されるようになります。同等なモデルのゾーンを参照してください。
適応型ペナルティの重み
適応型ダブルLassoの第2段階で使用されるペナルティの重みの計算オプションです。デフォルトでは、[推定値の逆数]オプションが選択されています。このオプションでは、第1段階におけるパラメータ推定値を使用して、ペナルティの重みを計算します。
「逆モデル平均」オプションでは、AICcまたはBICから計算された重みによりパラメータ推定値の重み付け平均を求めます。AICcによる検証法が選択された場合は、AICcが使用されます。それ以外は、BICが使用されます。「逆モデル平均」オプションを使用した場合、最尤推定値が存在する場合には、適応型ダブルLassoモデルの「パラメータ推定値の経路」における最も右側が最尤推定値を表しています。
強制的に含める項
モデルに強制的に含めたい項があれば、ここで指定します。モデルに強制的に含められる項は、ペナルティに含まれません。