1.
|
[ヘルプ]>[サンプルデータライブラリ]を選択し、「Equity.jmp」を開きます。
|
2.
|
3.
|
「BAD」を選択し、[Y, 目的変数]をクリックします。
|
4.
|
5.
|
「Validation」列を選択し、[検証]ボタンをクリックします。
|
6.
|
[OK]をクリックします。
|
8.
|
[項数に対する複数のあてはめ]を選択し、「項の最大数」の横に「5」と入力します。
|
9.
|
(オプション)[マルチスレッドをオフにする]を選択し、「乱数シード値」の横に「123」と入力します。
|
10.
|
[OK]をクリックします。
|
図6.2 「全体の統計量」レポート
11.
|
「ブートストラップ森(BAD)」の横にある赤い三角ボタンをクリックし、[列の寄与]を選択します。
|
図6.3 「列の寄与」レポート
「列の寄与」レポートを見ると、顧客の信用リスクに関する最も強い説明変数は「DEBTINC」であることがわかります。これは、収入に対する債務の比です。その次に大きく寄与しているのは、顧客の評価である「VALUE」や、滞納している支払いの回数である「DELINQ」です。
1.
|
[分析]>[スクリーニング]>[欠測値を調べる]を選択します。
|
2.
|
3.
|
表示される警告で、[OK]をクリックします。
|
「REASON」と「JOB」は、値のデータタイプが文字型であるため、これらの列は[Y, 列]リストに追加されません。これらの2つの列にどのくらいの欠測値があるかを見るには、「一変量の分布」プラットフォームを使用してください(この例では図示されていません)。
4.
|
[OK]をクリックします。
|
図6.4 欠測値のレポート
「DEBTINC」列には1267個の欠測値があり、これはオブザベーション数の約21%に相当します。また、その他のほとんどの列にも欠測値があります。先ほどの例では起動ウィンドウにある[欠測値をカテゴリとして扱う]オプションを用いましたが、その場合、これらの欠測値を含んだデータも分析に使われます。詳細については、「パーティション」章の「欠測値をカテゴリとして扱う」(88ページ)を参照してください。