ロジスティック回帰は古くから普及している手法で、医薬品開発における用量反応データや、マーケティングの購買選択など、いろいろな分野で応用されています。非常に単純な手法であるにもかかわらず、初歩的な統計の授業では残念ながらあまり取り上げられません。ロジスティック回帰の文献(Hosmer and Lemeshow 1989)のほかに、多くのカテゴリカル分析のテキスト(Agresti 1990)で取り上げられています。正規分布の分布関数を使用する手法もあり、その場合の分析はプロビット分析と言います。また、同じ状況でも、カテゴリカル変数をX、連続変数をYとして考えて、ロジスティック回帰ではなく判別分析を行う人もいます。判別分析では、連続量のデータが固定された説明変数ではなく正規分布に従ったランダムな応答であると仮定されます。
「二変量の関係」におけるロジスティック単回帰分析は、説明変数が1つしかないモデルの結果をグラフで表現したものです。一方、「モデルのあてはめ」プラットフォームで行われるロジスティック回帰モデルでは複数の説明変数を扱えます。説明変数が2つ以上ある場合のロジスティック回帰モデルについては、『基本的な回帰モデル』のロジスティック回帰モデルを参照してください。
名義ロジスティック回帰では、ある水準に応答変数がなる確率を、説明変数の滑らかな関数によって表します。あてはめた確率は0~1の間をとります。また、説明変数のある値に対する確率を、すべての応答変数の水準で合計すると、1になります。
ロジスティック確率プロットでは縦軸が確率を表します。応答変数の水準数をkとすると、k - 1本の滑らかな曲線が作成され、それによって合計確率(1)が応答水準ごとに分割されます。ロジスティック回帰のあてはめでは、「観測された応答データが生じる確率の自然対数」を合計した値の符号を逆にしたものが最小化されます。この推定方法を「最尤法」と呼びます。
Yが順序尺度の場合、順序性を考慮したロジスティック回帰が行われます。応答変数が特定の水準以下になる累積確率がロジスティック曲線で表されます。それらのロジスティック曲線は、どの水準でも同じ形状で、水平方向の位置が異なるだけです。
順序ロジスティックモデルでは、応答変数の水準数をrとしたとき、累積ロジスティック曲線のr - 1個の異なる切片を推定しますが、傾きは1つです。実際に必要になることはまずありませんが、各パラメータ推定値を個別に検定することも可能です。
順序モデルは計算されるパラメータが名義モデルより少ないため、適切であれば順序モデルを使用した方が効率的です。特に、順序尺度の応答変数に水準が何百もあるときに適しています。