一般化線形モデルを作成するためには、まずデータの応答変数と説明変数を選択します。次に、適切なリンク関数と応答の分布を選択する必要があります。説明変数としては、連続変数・分類変数・交互作用のいずれも使用でき、自由に組み合わせることができます。表12.1は、一般化線形モデルの例をまとめたものです。
モデル |
応答変数 |
分布 |
デフォルトのリンク関数 |
---|---|---|---|
従来の線形モデル |
連続尺度 |
正規 |
恒等 g(m) = m |
ロジスティック回帰 |
度数または |
二項 |
ロジット |
対数線形モデルのPoisson回帰 |
度数 |
Poisson |
対数 g(m) = log(m) |
指数回帰 |
正の連続量 |
指数 |
「モデルのあてはめ」プラットフォームは、パラメータを最尤法により推定することで、一般化線形モデルをあてはめます。一般に、パラメータの最尤推定値には閉じた解がありません。そのため、Nelder and Wedderburn(1972)で提案されている手法を使い、反復計算によって数値的にモデルのパラメータが推定されます。また、過分散パラメータfの推定値は、Pearsonの適合度統計量をその自由度で割って計算されます。パラメータ推定値の共分散・標準誤差・信頼限界は、最尤推定量の漸近正規性に基づいて計算されます。
「モデルのあてはめ」プラットフォームの[一般化線形モデル]手法では、リンク関数と確率分布をいろいろな選択肢の中から選ぶことができます。表12.2は、用意されているリンク関数の種類をまとめたものです。
リンク関数名 |
リンク関数の式 |
---|---|
単位行列 |
g(m) = m |
Logit |
|
プロビット |
g(m) = F-1(m) この式でFは標準正規分布の累積分布関数。 |
対数 |
g(m) = log(m) |
逆数 |
g(m) = |
べき乗 |
|
補対数-対数 |
g(m) = log(–log(1 – m)) |
べき乗関数を選択すると、数値の入力ボックスが表示されます。そこに任意の数値を入力できます。
表12.3は、応答変数に対して使用できる分布とそれに関連する分散関数をまとめたものです。
分布 |
分散関数 |
---|---|
正規 |
V(m) = 1 |
二項 |
V(m) = m(1 – m) |
Poisson |
V(m) = m |
指数 |
V(m) = m2 |