この例では、車両重量によって、116台の車両のタイプを予測するとしましょう。車両のタイプは小さいものから順に、「Sporty」・「Small」・「Compact」・「Medium」・「Large」とします。
1. [ヘルプ]>[サンプルデータフォルダ]を選択し、「Car Physical Data.jmp」を開きます。
2. 「列」パネルで、「タイプ」の左側のアイコンを右クリックし、[順序尺度]を選択します。
3. 「タイプ」を右クリックし、[列情報]を選択します。
4. [列プロパティ]メニューから[値の表示順序]を選択します。
5. 上から順に「Sporty」・「Small」・「Compact」・「Medium」・「Large」となっていることを確認します。
6. [OK]をクリックします。
7. [分析]>[二変量の関係]を選択します。
8. 「タイプ」を選択し、[Y, 目的変数]をクリックします。
9. 「車両重量」を選択し、[X, 説明変数]をクリックします。
10. [OK]をクリックします。
レポートウィンドウが表示されます。
図8.6 「タイプ」を「車両重量」によってロジスティックであてはめたプロットの例
次の点を確認してください。
• 最初(一番下)の曲線は、所定の「車両重量」の車両が「Sporty」である確率を表しています。
• 2番目の曲線は、車両が「Small」または「Sporty」である確率を表しています。1番目と2番目の曲線の垂直距離が、車両が「Small」である確率です。
• プロットを見ると、予想どおり、重量が重い車両ほど「Large」である確率が高くなります。
• プロット上の点のX座標はデータの値です。Y座標は応答カテゴリの内側においてランダムにプロットされます。
X変数が応答変数に対して効果を持たない場合、ロジスティック曲線は水平になります。つまり、応答変数の各水準の確率が、説明変数の範囲全体にわたって一定になります。Figure 8.7のロジスティックプロットが、ロジスティック曲線が水平となる例です。このような場合では、「タイプ」の確率を予測するのに、「車両重量」は役立ちません。
図8.7 予測が無意味なデータとロジスティックプロットの例
説明変数の値から応答変数の値を完全に予測できる場合、ロジスティック曲線は事実上垂直になります。応答の予測値はどの説明変数の値においてもほぼ確か(確率がほとんど1)です。Figure 8.8のロジスティックプロットでは、「車両重量」が「タイプ」をほぼ完全に予測しています。
図8.8 予測が完全となるデータとロジスティックプロット
この場合、パラメータ推定値が非常に大きくなり、回帰レポート上に「不安定」と表示されます。そのような場合には、[一般化線形モデル]において[Firthバイアス調整推定値]を使用することを検討してください。『基本的な回帰モデル』の[一般化線形モデル]手法の起動を参照してください。
メモ: Figure 8.7およびFigure 8.8のプロットを再現するには、図中のデータテーブルを作成してから、この節の冒頭で紹介した手順7~10を実行します。