古典的なあてはめ手法のほとんどは、バネと圧力シリンダという驚くほど単純なメカニズムで説明できます。
バネの喩えは、連続尺度の応答変数に対するモデルを推定する枠組みをイメージするのに役立ちます(Farebrother 1987)。n個の点があり、その期待値(平均)を求めるとしましょう。点を平板の上に固定し、それぞれにバネをつけ、すべてのバネを1本の棒につないでみるとどうなるでしょうか(Figure A.7)。手を離すとバネの力で棒が上下に揺れ動きますが、しばらくすると平均の位置で停止します。この現象は物理学で説明できます。
棒の位置に平均がある正規分布に各点が従っているなら、各点のバネが持つ物理エネルギーは、各点の不確定性に比例します。すべてのバネのエネルギー(不確定性)を計算するには、各点と平均の距離の平方和を計算します。
観測データの不確定性を最小にするような推定値を選ぶには、バネが落ち着いた場所を平均の推定値とします。これは、バネを引き伸ばすために必要なエネルギーが最も少ない点であり、最小2乗法によるあてはめに相当します。
図A.7 データ点にバネをつける
以上の喩えが、1つまたは複数の平均を推定する枠組みです。この枠組みは、1本の直線、1つの曲面、または1つの超曲面をあてはめる方法でもあります。連続尺度のデータには、この枠組みでほとんどすべてのモデルをあてはめることができます。エネルギー(不確定性)は、バネを引き伸ばさなければならない距離の平方和として計算します。
統計学者が正規分布に信頼を置くのは、正規分布が最も信頼を必要としない分布だからです。正規分布は、ある意味では最もランダムで、得られる情報の最も少ない分布です。与えられた分散について、期待される不確定性が最も大きい分布です。不確定性が平方距離で測定される分布でもあります。独立した確率変数を足し合わせた和の極限分布は、多くの場合、正規分布になります。また、正規分布からは検定統計量をとても簡単に導出できます。
仮説によってあてはめが制約されている場合も、同じようにバネのエネルギーを測定することで仮説を検定します。たとえば、1つの実験で4種類の異なる処置から応答を得たとします。それぞれの平均が有意に異なるかどうかを検定します。まず、データがFigure A.8のようにグループ単位でプロットされていて、処置ごとの平均にバネがついていると想像してください。次に、各平均を共通の平均へ移動させるため、バネに力を加えてみてください。さあ、どうなるでしょうか。各平均が同じ位置に留まろうとするのを制約するエネルギーが、ここで必要とされる検定統計量に相当します。このエネルギーは、平均が等しいかどうかを調べるF検定の主要な要素です。
図A.8 応答変数が連続尺度である場合の一元配置
応答が連続尺度ではなく、カテゴリカルであるときはどうすればいいでしょうか。たとえば、自動車に関するデータで、各自動車の生産国が応答変数だとします。このデータには、「米国」、「ヨーロッパ」、「日本」という3つの応答水準があるとします。生産国ごとの確率を何らかの推定値に設定して、データの不確定性を評価することができます。不確定性を求めるには、データによって与えられた応答の確率から対数を取り、符号を逆にして合計します。この不確定性は、次のように定義されます。
前述のバネの喩えは、連続尺度のデータに平均をあてはめる方法を説明するものでした。カテゴリカルな応答では、各応答水準の確率の推定値が直接的に計算され、データ全体の不確定性が最小になるような推定値が選択されます。確率の推定値は、各推定値は0以上で、それらの合計は1でなければなりません。応答の確率は、長さが1である定規を複数の部分に分けたものと考えることができます。1つずつの観測値を1つのガス圧シリンダ(タイヤの空気入れ)として、それらのシリンダを応答の水準を表す領域に分けて配置します。水準を表す領域の区分けは上下に動きますが、しばらくすると位置エネルギーが最小になる均衡点で落ち着きます。その結果得られる領域のサイズが、応答確率の推定値です。
Figure A.9は、1つのカテゴリ(「中型」サイズの自動車)の状況がどうなるかを図示したものです(Figure A.10にある「Car Poll.jmp」ファイルのモザイク図で「中型」列を参照)。ここでは、13個の観測値(自動車)があります。最初の水準(「米国」)には6台、次の水準には2台、最後の水準には5台あります。各応答の区分け領域の圧力が均衡し、全体のエネルギーが最小になったとき、応答の確率はそれぞれ6/13、2/13、5/13になります。
図A.9 区分け領域に分かれた圧力シリンダの効果
連続尺度のデータのバネと同じく、因子がある場合には、グループごとにあてはめるために、標本をグループごとの領域に分割します。「応答の各水準の割合がどのグループでも等しい」という仮説を検定するためには、各領域が等しくなるためにどれほどの力を加えなければならないかを測定します。自動車の生産国の確率を表す圧力シリンダが、自動車のサイズごとにグループ化されているとします。確率が等しいかどうかを検定するため、各グループ内のそれぞれの区分け領域が水平方向で整列するように力を加えます。Figure A.10は、これらの区分けを示しています。
図A.10 カテゴリカルなデータのモザイク図