「一般化回帰」プラットフォームを起動するには、[分析]>[モデルのあてはめ]を選択します。1つ以上の列を[Y]に指定し、「手法」メニューから[一般化回帰]を選択します。
図6.4 [一般化回帰]手法を選択した「モデルのあてはめ」起動ウィンドウ
すべての手法に共通の「モデルのあてはめ」ウィンドウの要素の詳細については、モデルの指定を参照してください。「列の選択」の赤い三角ボタンのメニューのオプションについては、『JMPの使用法』の列フィルタメニューを参照してください。ここでは、「一般化回帰」手法に特有の機能について説明します。
[一般化回帰]手法で行われる名義尺度の変数のパラメータ化は、他の「モデルのあてはめ」手法で使用されているパラメータ化とは異なります。「一般化回帰」手法では、指示変数に基づくパラメータ化が採用されています。指示変数に基づくパラメータ化では、名義尺度の説明変数における各パラメータ推定値は、その水準の応答平均と、最後の水準の応答平均との差を表します。最後の水準とは、データを並び替えたときに最後になっている水準です。その最後の水準に対する指示変数は、モデルに含まれません。
「一般化回帰」手法においても、モデル効果に欠測値が含まれている場合、それらの欠測値を1つのカテゴリとして処理することができます。それには、「モデルの指定」の赤い三角ボタンのメニューから、[欠測値をカテゴリとして扱う]を選択します。
切片項を除いたモデルを指定するには、「モデルのあてはめ」ウィンドウの「モデル効果の構成」パネルで[切片なし]を選択してください。このオプションを選択する場合は、次の点に注意してください。
• 説明変数の標準化が行われなくなります。
• レポートウィンドウにオッズ比、ハザード比、発生率比を表示することができなくなります。
• [切片なし]オプションは、[順序ロジスティック]分布では使用できません。
警告: [切片なし]オプションを使用したときには、単純なLassoおよび弾性ネットは推奨されません。これらの方法は、各効果の測定単位によって、結果が大きく変わるためです。[切片なし]オプションを使用したときには、適応型の推定を行うようにしてください。
応答変数のデータが打ち切りデータであることは、次のいずれかの方法で指定します。
• 右側打ち切りの場合は、起動ウィンドウで右側打ち切りであるか否かを示す列を「打ち切り」列に指定します。「打ち切りの値」リストに列の値が表示されているので、その中から打ち切りを示す値を選択します。
• 区間打ち切りと左側打ち切りの場合は、打ち切りの各区間を定義する2つの列を[Y]として指定します。
– 2つのY変数が非欠測値だった場合には、区間打ち切りデータとみなされ、最初のY変数が区間の下限、2番目のY変数が区間の上限とみなされます。
– 最初のY変数が欠測値で、2番目のY変数が非欠測値だった場合には、左側打ち切りデータとみなされます。
– どちらの場合も、2番目のY変数は、打ち切りデータの上限とみなされます。
Y変数として2つの列を指定し、かつ、打ち切りデータに対応している確率分布を選択した場合、指定された2つの列が打ち切りデータであるかどうかを確認するメッセージが表示されます。[いいえ]を選択した場合、各列は、1つ1つの個別の応答変数として扱われます。
注: 応答として2つの列を指定した場合のデフォルトの扱い方は、「一般化回帰」プラットフォームの環境設定にある[2列ある応答列の処理]で指定できます。
打ち切りデータは、分布として正規、指数、ガンマ、Weibull、対数正規、Coxの比例ハザードを指定した場合にサポートされます。