この例では、Poisson回帰を使ってカブトガニの巣穴に関する度数データをモデル化します。メスのカブトガニの巣穴には、オスのカブトガニが1匹ずつ棲んでいます。調査では、近くにサテライト(衛星)と呼ばれる他のオスがいるかどうか調べ、データにまとめました。「CrabSatellites.jmp」データテーブルには、オスのサテライトの数を示す応答変数の他に、メスの色、脊柱の状態(緑棘)、体重、甲羅の幅といった変数があります。サテライトの数とメスの状態を示す変数の関係を調べてみましょう。
Poisson回帰モデルをあてはめるには、次の手順に従います。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「CrabSatellites.jmp」を開きます。
2. [分析]>[モデルのあてはめ]を選択します。
3. 「サテライト数」を選択し、[Y]をクリックします。
4. 「色」、「緑棘」、「幅」、「体重」を選択し、[追加]をクリックします。
5. 「手法」リストから[一般化線形モデル]を選択します。
6. 「分布」リストから[Poisson]を選択します。
「リンク関数」リストでは、自動的に[対数]が選択されます。
7. [実行]をクリックします。
図12.2 カニのサテライトの分析結果
「モデル全体の検定」表から、完全モデルと縮小モデルの対数尤度の差が41.6であることがわかります。「p値(Prob>ChiSq)」は、通常の分散分析表におけるF検定のp値(モデル全体に対するF検定のp値)と同じように解釈します。0.0001より小さいp値は、モデル全体が有意であることを示します。レポートには、修正済みの赤池の情報量規準(AICc)の値も表示されています(921.7613)。この値をモデル間で比較すれば、統計的に良いモデルを特定できます。AICcが小さいほど、良いモデルであることを示しています。
「効果の検定」レポートは、「体重」がモデル内で有意な因子であることを示しています。「体重」のp値は0.0026で、「パラメータ推定値」表でも同じ値です。これは、「体重」が連続尺度の変数であるためです。
「効果の検定」レポートからは、カテゴリカル変数の「色」が有意であることがわかります。「色」には、「LightMed」、「Medium」、「Dark Med」、「Dark」の4水準があります。最初の3つのレベルのパラメータ推定値は、パラメータ推定値表に表示されています。「Dark」のパラメータ推定値は、最初の3水準のパラメータ推定値を合計した値に負号を付けたものです。
「予測プロファイル」を使用して、さらにモデルを探索することができます。
8. 「一般化線形モデルのあてはめ」の赤い三角ボタンをクリックし、[プロファイル]>[プロファイル]を選択します。
図12.3 サテライト数の予測プロファイル
「体重」に対する予測値の信頼区間を見てみると、「体重」が重いカニよりも、「体重」軽いカニにおいて予測値のばらつきが少ないことを示しています。プロファイルを使用すると、カテゴリカルな変数の水準も簡単に探索できます。このプロファイルから、カニが明るい色から暗い色に変化するにつれて、サテライトのカニの匹数に対する予測値が減少することが見て取れます。