「Diabetes.jmp」は、糖尿病患者442名の測定データで構成されています。関心のある応答Yは、ベースライン時点から1年後の症状進行を定量的に表したものです。症状の進行に関連すると思われる10個の変数も、ベースライン時点で測定されています。この例では、一般化回帰手法を使って予測モデルを作成する方法を説明します。
1.
|
[ヘルプ]>[サンプルデータライブラリ]を選択し、「Diabetes.jmp」を開きます。
|
2.
|
[分析]>[モデルのあてはめ]を選択します。
|
3.
|
4.
|
これにより、2次までのすべての項がモデルに追加されます(「2」は、[次数]ボックスのデフォルト値です)。
5.
|
6.
|
「手法」のリストから[一般化回帰]を選択します。
|
7.
|
[実行]をクリックします。
|
8.
|
[実行]をクリックします。
|
「適応型Lasso (検証法: 検証列)」レポートが表示されます。「パラメータ推定値の経路」レポート(「パラメータ推定値の経路」プロット)に、「パラメータ推定値」と「尺度化した負の対数尤度」が表示されます。「尺度化したパラメータ推定値の絶対値の和」が小さくなるほど、パラメータ推定値はより縮小されています。プロットの一番右の推定値は、最尤法による推定値になります。赤い縦線は、指定された検証法によって選択されたパラメータ推定値を表しています。この例で指定された検証法は、「検証」列に定義された値に基づき学習データと検証データに分割して、検証を行っています。
図6.2 「パラメータ推定値の経路」プロット
9.
|
「適応型Lasso (検証法: 検証列)」レポートの赤い三角ボタンのメニューから、[非ゼロの項を選択]オプションを選択します。
|
「元の説明変数に対する推定値」レポート(「元の説明変数に対する推定値」レポート(一部))と「パラメータ推定値の経路」プロットで非ゼロの項が強調表示されます。この時、データテーブルでも対応する列が選択されます。55個のパラメータ推定値のうち、ゼロでないものは7個だけです。なお、「元のデータに対するパラメータ推定値」レポートの最後の別表に表示されているのは、正規分布の標準偏差(シグマ、尺度パラメータ)です。
予測式を保存するには、「適応型Lassoによる推定(検証法: 検証列)」レポートの赤い三角ボタンのメニューから、[列の保存]>[予測式の保存]を選択します。