「ブースティングツリー」プラットフォームを起動するには、[分析]>[予測モデル]>[ブースティングツリー]を選択します。
図6.6 「Body Fat.jmp」を使ったときの「ブースティングツリー」起動ウィンドウ
「列の選択」の赤い三角ボタンのメニューのオプションについては、『JMPの使用法』の列フィルタメニューを参照してください。
「ブースティングツリー」プラットフォームの起動ウィンドウには以下のオプションがあります。
Y, 目的変数
分析したい目的変数(応答変数)。
X, 説明変数
モデルに含める説明変数。
重み
分析において各行の重みとして使用される数値を含む列。
度数
分析において各行の度数として使用される数値を含む列。
検証
検証セットを定義する数値列。この列には最大3つの異なる値が含まれていなければなりません。
– 検証列の値が2つしかない場合は、小さい方の値が学習セット、大きい方の値が検証セットとして扱われます。
– 水準が3つの場合は、値が小さいものから順に、学習セット・検証セット・テストセットとして使われます。
– 検証列に4つ以上の水準がある場合は、小さい方から3つの値を含む行が検証セットとして使われます。その他の行はすべて分析から除外されます。
「ブースティングツリー」プラットフォームでは、検証列を使ってモデルを学習・調整するか、またはモデルを学習・調整・評価します。検証については、JMPのモデル化での検証を参照してください。
「列の選択」リストで列を選択せず、[検証]ボタンをクリックすると、データテーブルに検証列を新規作成することができます。検証列を作成する方法の詳細については、検証列の作成を参照してください。
By
別々に分析を行いたいときに、そのグループ分けをする変数を指定します。指定された列の水準ごとに、別々に分析が行われます。各水準の結果は別々のレポートに表示されます。複数のBy変数を割り当てた場合、それらのBy変数の水準の組み合わせごとに別々のレポートが作成されます。
手法
パーティションの手法として、[ディシジョンツリー]・[ブートストラップ森]・[ブースティングツリー]・[K近傍法]・[単純Bayes]を選択できます。[ディシジョンツリー]以外の手法は、JMP Proでのみ利用できます。
これらの手法の詳細については、パーティション、ブートストラップ森、K近傍法、および単純 Bayesを参照してください。
検証データの割合
データ全体のうち検証セットに割り振るデータの割合です。
欠測値をカテゴリとして扱う
説明変数がカテゴリカルな場合、このチェックボックスをオンにすると、分析において、欠測値が1つのカテゴリとして扱われます。説明変数が連続尺度の場合は、欠測値が同一の数値を持つものとして扱われます。ROC曲線を参照してください。
順序尺度列の順序を保つ
このチェックボックスをオンにすると、順序尺度の列において、順序を保つ分岐だけが考慮されるようになります。