バネの喩えは、連続尺度の応答変数に対するモデルを推定する枠組みをイメージするのに役立ちます(Farebrother 1987)。n個の点があり、その期待値(平均)を求めるとしましょう。点を平板の上に固定し、それぞれにバネをつけ、すべてのバネを1本の棒につないでみるとどうなるでしょうか(データ点にバネをつける)。手を離すとバネの力で棒が上下に揺れ動きますが、しばらくすると平均の位置で停止します。この現象は物理学で説明できます。
図A.7 データ点にバネをつける
仮説によってあてはめが制約されている場合も、同じようにバネのエネルギーを測定することで仮説を検定します。たとえば、1つの実験で4種類の異なる処置から応答を得たとします。それぞれの平均が有意に異なるかどうかを検定します。まず、データが応答変数が連続尺度である場合の一元配置のようにグループ単位でプロットされていて、処置ごとの平均にバネがついていると想像してください。次に、各平均を共通の平均へ移動させるため、バネに力を加えてみてください。さあ、どうなるでしょうか。各平均が同じ位置に留まろうとするのを制約するエネルギーが、ここで必要とされる検定統計量に相当します。このエネルギーは、平均が等しいかどうかを調べるF検定の主要な要素です。
図A.8 応答変数が連続尺度である場合の一元配置
区分け領域に分かれた圧力シリンダの効果は、1つのカテゴリ(「中型」サイズの自動車)の状況がどうなるかを図示したものです(カテゴリカルなデータのモザイク図にある「Car Poll.jmp」ファイルのモザイク図で「中型」列を参照)。ここでは、13個の観測値(自動車)があります。最初の水準(「米国」)には6台、次の水準には2台、最後の水準には5台あります。各応答の区分け領域の圧力が均衡し、全体のエネルギーが最小になったとき、応答の確率はそれぞれ6/13、2/13、5/13になります。
図A.9 区分け領域に分かれた圧力シリンダの効果
連続尺度のデータのバネと同じく、因子がある場合には、グループごとにあてはめるために、標本をグループごとの領域に分割します。「応答の各水準の割合がどのグループでも等しい」という仮説を検定するためには、各領域が等しくなるためにどれほどの力を加えなければならないかを測定します。自動車の生産国の確率を表す圧力シリンダが、自動車のサイズごとにグループ化されているとします。確率が等しいかどうかを検定するため、各グループ内のそれぞれの区分け領域が水平方向で整列するように力を加えます。カテゴリカルなデータのモザイク図は、これらの区分けを示しています。
図A.10 カテゴリカルなデータのモザイク図