基本的な回帰モデル > 混合モデル > 混合モデルを使った例
公開日: 11/25/2021

Image shown here混合モデルを使った例

乾燥地域向けに改良した小麦(ハードレッドウインター小麦)の中から、10種類の品種を無作為抽出し、農業試験を行いました。この農業試験では、各品種ごとに6つの区画が用意され(合計で60区画)、無作為に割り付けられました。なお、1区画の面積は1エーカーで、全体では60エーカーです。研究者は、各区画における土壌の水分量が小麦の発芽に影響を与えると考えています。さらに、その結果、最終的な収量にも土壌の水分量が影響すると考えています。そこで、種蒔きの前に、地面下36インチの土壌の水分量を全区画で測定しました。水分量が収量にどのように影響しているかを特定したいため、水分量を説明変数とし、収量を応答変数とした回帰式をあてはめます。

この農業試験では、品種は無作為に抽出されているため、次のようなモデルが仮定できます。「母集団においては、数多くの品種が存在しており、品種ごとに回帰式が成立している。母集団におけるその回帰式は、1つ1つの品種ごとに異なっている。そして、ここでの10品種の1つ1つの回帰式は、その母集団の回帰式から無作為に抽出したものである」というモデルです。このような仮定やモデルをもとに、切片や傾きが、それぞれの品種ごとにランダムに異なっているとします(つまり、回帰式の切片や傾きが、確率変数であると仮定します)。ランダムに分布している切片と傾きには相関があると考えるのが自然でしょう。また、このランダムな切片や傾きは、固定効果で表される期待値を中心として、確率的に分布していると仮定します。固定効果として指定された切片や傾きは、品種ごとにランダムに散らばっている切片と傾きの期待値を表します。この固定効果は、母集団において、ランダムではない、固定された値です。この例は、Littell et al.(2006, p. 320)に記載されているものです。

品種ごとに回帰直線を描いてみると、切片と傾きにおけるばらつきを確認できます(図8.2)。傾きはあまりばらついていませんが、切片はかなりばらついています。また、切片と傾きには、切片が小さい品種の方が傾きが大きそう、つまり、負の相関がありそうです。

図8.2 標準最小2乗の回帰 

Standard Least Squares Regression

切片と傾きを確率変数としたランダム係数モデルをあてはめるために、[混合モデル]手法を使ってみましょう。ここでの分析目的は、母集団での全体の回帰式、および、各品種での回帰式を推定することです。

1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Wheat.jmp」を開きます。

2. [分析]>[モデルのあてはめ]を選択します。

3. 「収率」を選択し、[Y]をクリックします。

この列を[Y]として追加すると、「手法」が[標準最小2乗]になります。

4. 「手法」リストから[混合モデル]を選択します。または、[混合モデル]手法を選択してから、[Y]をクリックして「収率」を追加します。

5. 「土壌水分」を選択し、[固定効果]タブで[追加]をクリックします。

図8.3 指定が完了した「モデルのあてはめ」起動ウィンドウの[変量効果]タブ 

Completed Fit Model Launch Window Showing Fixed Effects

6. [変量効果]タブをクリックします。

7. 「土壌水分」を選択し、[追加]をクリックします。

8. 「列の選択」リストから「品種」を選択し、[変量効果]タブの「土壌水分」を選択し、[ランダム係数 枝分かれ]ボタンをクリックします。

図8.4 入力が完了した「モデルのあてはめ」起動ウィンドウ、[変量効果]タブ 

Completed Fit Model Launch Window Showing Random Effects Tab

この操作により、品種を水準とした、傾きの変量効果が追加されます。また、切片の変量効果も追加されます。

9. (オプション)「モデルの指定」の赤い三角ボタンをクリックして、[多項式の中心化]オプションの設定を確認します。

変量効果に含まれている項は[多項式の中心化]オプションが選択されていても中心化されないため、[多項式の中心化]オプションを選択したとしても「土壌水分」は中心化されません。

10. [実行]をクリックします。

図8.5のような「混合モデルのあてはめ」レポートが表示されます。「予測値と実測値のプロット」を見ると、モデルの仮定には特に問題がなさそうです。

モデルの仮定には特に問題がなさそうなので、次に検定や回帰式を解釈していきましょう。「固定効果の検定」レポートを見ると、収率に対する土壌水分の効果は有意です。「固定効果のパラメータ推定値」にレポートされている推定値から、母集団での全体の回帰式は次のようになります。

収率 = 33.43 + 0.66 × 土壌水分

「変量効果の共分散パラメータ推定値」レポートを見ていきましょう。「Var(切片)」には、品種による切片のばらつき(分散)の推定値が表示されています。「Var(土壌水分)」には、品種による傾きのばらつき(分散)の推定値が表示されています。「Cov(土壌水分, 切片)」には、切片と傾きとの共分散が表示されています。この例では、共分散の推定値に対する信頼区間には0が含まれているので、切片と傾きとの相関は有意ではありません。最後の行の推定値は、残差誤差の分散に対する推定値です。

図8.5 「混合モデルのあてはめ」レポート 

Fit Mixed Report

母集団での全体での回帰式の推定値が求まりました。さらに、品種ごとの回帰式を見ていきましょう。ここでは、品種が「2」であるときの回帰式も求めてみましょう。

11. 「ランダム係数」レポートを開き、切片と土壌水分の推定値を見ましょう。これらの係数は、各品種が全体の期待値から、どれぐらい異なるかを予測したものです。

図8.6 「ランダム係数」レポート 

Random Coefficients Report

「固定効果のパラメータ推定値」と「ランダム係数」の各レポートにある品種2の推定値を使い、次のような回帰式が得られます。

収率 = 33.433 + 0.662 × 土壌水分 – 2.284 – 0.067 × 土壌水分

収率 = 31.149 + 0.595 * 土壌水分

品種2の切片は、母集団全体での切片の平均よりも小さくなっています。また、傾きも、母集団全体での傾きの平均よりも小さくなっています。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).