このバージョンのヘルプはこれ以降更新されません。最新のヘルプは https://www.jmp.com/support/help/ja/15.2   からご覧いただけます。


「Liver Cancer.jmp」サンプルデータには、136 名の患者の「結節数」の値がまとめられています。また、関連があると考えられる6つの変数、「BMI」「年齢」「時間」「マーカー」「肝炎」「黄疸」も含まれています。これらの列については、データテーブルの各列のノートに説明があります。
この例では、6つの説明変数を使って「結節数」の予測モデルを作成します。「結節数」はPoisson分布を使ってモデル化します。
1.
[ヘルプ]>[サンプルデータライブラリ]を選択し、「Liver Cancer.jmp」を開きます。
3.
「列の選択」リストで「結節数」を選択し、[Y]をクリックします。
4.
「BMI」から「黄疸」までを選択し、[マクロ]>[設定された次数まで]をクリックします。
5.
「列の選択」リストで「検証」を選択し、[検証]をクリックします。
6.
「手法」のリストから[一般化回帰]を選択します。
7.
「分布」リストから[Poisson]を選択します。
8.
[実行]をクリックします。
9.
[実行]をクリックします。
「パラメータ推定値の経路」は非ゼロの項が強調表示された、Lassoの経路のようになります。パラメータ推定値がゼロではない項の経路が強調表示されています。パラメータ推定値の経路は、プロット上を右から左へ見てください。一番右側は最尤推定値です。罰則が大きくなるにつれて、プロットの左側へと移動していき、最終的に、すべてのパラメータ推定値はゼロに縮小していきます。いくつかの項は、かなり早い時点でゼロに縮小しています。
図7.1 非ゼロの項が強調表示された、Lassoの経路
「元の説明変数に対する推定値」レポート(非ゼロの項が強調表示されたパラメータ推定値レポート)には、標準化していない元の説明変数に対するパラメータ推定値が表示されます。パラメータ推定値がゼロでない11個の項が強調表示されます。これには、交互作用の効果も含まれています。データテーブルで選択されている6つの列は、ゼロではないパラメータ推定値の項を含む列です。
11.
「元の説明変数に対するパラメータ推定値」レポートで、「(年齢 ‐ 56.3994)* マーカー[0-1]」をクリックします。
図7.2 非ゼロの項が強調表示されたパラメータ推定値レポート
12.
「適応型Lassoによる推定 (検証法: 検証列)」レポートの赤い三角ボタンをクリックし、[列の保存]>[予測式の保存][列の保存]>[分散計算式の保存]を選択します。
データテーブルに、「結節数 予測式」「分散 結節数」という2つの列が追加されます。
13.
計算式を確認するには、どちらかの列の見出しを右クリックし、[計算式]をクリックします。または、「列」パネルで列名の右側にある+記号をクリックします。
「結節数 予測式」列の計算式は、モデルの線形式に指数関数を適用したものになっています。「分散 結節数」の計算式は、予測式と同じ計算式によって求められます。同じ計算式になっているのは、Poisson分布の分散は、その平均と等しいからです。