「パーティション」の赤い三角ボタンのメニューには、必要に応じてレポートをカスタマイズするためのオプションがあります。使用できるオプションは、分析に使用したデータの種類によって決まります。
表示オプション
レポート要素の表示と非表示を切り替えるオプションがあります。
点の表示
点を表示します。カテゴリカルな応答の場合、点を表示するか、または色のついた矩形領域を表示するかを切り替えます。
ツリーの表示
パーティションツリー(大きいツリー)を表示します。
グラフの表示
データをプロットしたグラフを表示します。
カラーバーの表示
(応答がカテゴリカルな場合にのみ使用可能。)各ノードにおいて、分岐の割合を示す色つきのバーを表示します。
分岐統計量の表示
分岐統計量を表示します。カテゴリカルの分岐統計量であるG2については、「パーティション」プラットフォームの統計的詳細を参照してください。
割合を表示
(応答がカテゴリカルな場合にのみ使用可能。)各ノードにおいて、割合と確率を表示します。
なお、[度数を表示]を選択すると、度数とともに、割合と確率も一緒に表示されます。「割合」と「確率」の詳細については、「パーティション」プラットフォームの統計的詳細を参照してください。
度数を表示
(応答がカテゴリカルな場合にのみ使用可能。)各ノードにおいて、度数を表示します。このオプションを選択すると、[割合を表示]も自動的に選択されます。また、[割合を表示]の選択を解除すると、度数も表示されなくなります。
分岐の候補を表示
「候補」レポートを表示します。
分岐の候補を並べ替え
「候補」レポートにおける列を、統計量と対数価値のいずれかに基づいて並べ替えます。
最良分岐
ツリーを最適な分岐点で分岐します。これは[分岐]ボタンをクリックするのと同じことです。
最悪分岐を剪定
応答変数を識別する能力が最も弱い分岐が削除されます。これは[剪定]ボタンをクリックするのと同じです。
分岐の最小サイズ
度数または割合を入力して、分岐の最小許容サイズを指定します。度数(標本サイズ)として指定する場合は、1以上の値を入力してください。全体に対する割合として指定する場合は、1未満の値を入力してください。デフォルト値は、5と、行数を10,000で割った値以下の最大の整数のうち、いずれか大きいほうの値に設定されます。
列のロック
分岐の対象とならないように、列をロックします。なお、列はロックされているか否かとは無関係に、その表示と非表示を切り替えることができます。
予測値と実測値のプロット
(応答が連続尺度の場合にのみ使用可能。)予測された応答値と実際の応答値の関係を示すプロットを表示します。ディシジョンツリーをあてはめた場合、各葉に属するすべてのデータ行で予測値は同じになるので、葉の数がn枚の場合、「予測値と実測値のプロット」の横軸には、多くてn個の異なる予測値にプロットされます。よって、実測値は、n本の縦線上で各葉の平均を中心に散らばります。
プロットには対角線が含まれており、これはY = Xの直線です。あてはまりが完全なら、すべての点が対角線上に並びます。検証セットが使用されている場合は、学習セットと検証セットの両方におけるグラフが描かれます。
小さいツリー表示
プロットの右側に小さなツリーを表示します。
三次元ツリー
三次元に描かれたツリーを表示します。このオプションにアクセスするには、Shiftキーを押しながら三角ボタンのメニューをクリックします。
葉のレポート
最下位のノードについて、それぞれの平均値と度数を表示します。
列の寄与
各列があてはめにどれだけ寄与したかを示すレポートを表示します。レポートには、その列が分岐した回数や、その列に起因するG2の合計、または平方和の合計が表示されます。
分岐履歴
分岐の回数に対するR2乗のプロットを表示します。検証セットを利用した場合(除外した行で検証を行う場合、保留によって検証を行う場合、または、検証列を使用した場合)は、学習セットと検証セットの両方に関して、R2乗値の曲線が描かれます。曲線は、学習セットは青色、検証セットは赤色で描かれます。また、[K分割交差検証]を選択した場合は、すべてのデータの曲線が青色で、交差検証のR2乗曲線が緑色で表示されます。
ROC曲線
(応答がカテゴリカルな場合にのみ使用可能。)ROC(Receiver Operating Characteristic; 受診者動作特性)曲線を描きます。ROC曲線は、応答水準を予測確率で並べ替えて、モデルの予測精度を見るものです。ROC曲線を参照してください。
リフトチャート
(応答がカテゴリカルな場合にのみ使用可能。)リフトチャートを描きます。リフトチャートは、モデルの予測精度を見るものです。リフトチャートを参照してください。
分類の閾値
(2値のカテゴリカルな応答変数でのみ使用可能。)学習セット・検証セット・テストセットが指定されている場合に、それらに対する「分類の閾値」レポートの表示と非表示を切り替えます。各レポートには、それぞれのモデルの予測確率の分布を示すグラフ、各モデルの混同行列、モデルのあてはめを比較できる分類グラフ、および分類精度の指標のグラフが含まれています。「分類の閾値」レポートを参照してください。
「あてはめの詳細」の表示
(カテゴリカルな応答のみ)「あてはめの詳細」レポートには、あてはめに関するいくつかの指標と「混同行列」レポートが表示されます。「あてはめの詳細」の表示を参照してください。
列の保存
モデルやツリーの結果を保存するオプション、およびSASコードを作成するオプションがあります。
残差の保存
モデルの残差をデータテーブルに保存します。
予測値の保存
モデルの予測値をデータテーブルに保存します。
葉の番号を保存
ツリーの葉の番号をデータテーブルに保存します。
葉のラベルを保存
ツリーの葉のラベルをデータテーブルに保存します。ラベルを見ると、ツリーのどの枝をたどればその行が見つかるかがわかります。枝は「&」で区切られています。たとえば、「サイズ(小型,中型)&サイズ(小型)」のようになります。ただし、カテゴリを示すラベルが繰り返しになるときは、省略されます。葉のラベルがツリーの上位にあるノードのカテゴリを含む場合、繰り返しになる部分が「^」で置き換えられます。たとえば「サイズ(小型,中型)&サイズ(小型)」は、「^&サイズ(小型)」と表示されます。
予測式の保存
予測式をデータテーブルの列に保存します。予測式は、条件節が枝分かれした形で、ツリーの構造を反映しています。応答変数が連続尺度の場合、予測式を含む列が1つだけ作成され、その列には「予測対象」列プロパティが割り当てられます。応答変数がカテゴリカルの場合、応答変数の各水準ごとに予測確率を含む列が作成され、各列には「応答確率」列プロパティが割り当てられます。さらに、予測確率が最も大きくなっている応答水準を含む「最尤」列が追加されます。
欠測処理予測式の保存
データに欠測値があり、かつ[欠測値をカテゴリとして扱う]チェックボックスがオフの場合に、欠測値をランダムに処理する予測式を保存します。この予測式では、説明変数が欠測値の場合、どちらに分岐するかがランダムに決められます。応答変数が連続尺度の場合、作成される予測式の列には、[予測対象]列プロパティが割り当てられます。応答変数がカテゴリカルな場合は、作成される予測式の各列には、「応答確率」列プロパティが割り当てられます。[欠測値をカテゴリとして扱う]チェックボックスをオンにした場合は、Shiftキーを押しながらレポートの赤い三角ボタンをクリックすると、[欠測処理予測式の保存]を選択できます。
葉の番号の式を保存
葉の番号を求める計算式をデータテーブルの列に保存します。
葉のラベルの式を保存
葉のラベルを求める計算式をデータテーブルの列に保存します。
SAS DATAステップの作成
SASデータセットのスコア計算に使用できるSASコードを作成します。
予測式を発行
予測式を作成し、それを「計算式デポ」プラットフォームの計算式列のスクリプトとして保存します。「計算式デポ」レポートが開いていない場合は、このオプションによって「計算式デポ」レポートが作成されます。計算式デポを参照してください。
欠測処理予測式を発行
欠測処理予測式を作成し、それを「計算式デポ」プラットフォームの計算式列のスクリプトとして保存します。「計算式デポ」レポートが開いていない場合は、このオプションによって「計算式デポ」レポートが作成されます。計算式デポを参照してください。[欠測値をカテゴリとして扱う]チェックボックスを選択した場合は、Shiftキーを押しながらレポートの赤い三角ボタンをクリックすると、このオプションを使用できます。
利益行列の指定
(応答変数がカテゴリカルの場合にのみ使用可能。)分類の判定が正しいときや正しくないときの利益や損失を指定できます。名義尺度の応答の場合は、確率の閾値を使用して利益行列の各要素を指定できます。利益行列の指定を参照してください。
プロファイル
対話式のプロファイルを表示します。因子の値を変更すると、それに応じて、予測値の曲線が描かれます。『プロファイル機能』のプロファイルを参照してください。
プロット点の色分け
(応答がカテゴリカルな場合にのみ使用可能。)応答のグループごとに、点に色をつけます。これは[プロット点の色分け]ボタンをクリックするのと同じことです。「パーティション」レポートを参照してください。
以下のオプションの詳細については、『JMPの使用法』の「JMPレポートのローカルデータフィルタ」、「JMPレポートの[やり直し]メニュー」、および「JMPレポートの[スクリプトの保存]メニュー」を参照してください。
ローカルデータフィルタ
データをフィルタリングするためのローカルデータフィルタの表示/非表示を切り替えます。
やり直し
分析を繰り返したり、やり直したりするオプションを含みます。また、[自動再計算]オプションに対応しているプラットフォームにおいては、[自動再計算]オプションを選択すると、データテーブルに加えた変更が、該当するレポートに即座に反映されるようになります。
プラットフォーム環境設定
現在のプラットフォームの環境設定を表示したり、現在のJMPレポートの設定に合わせて環境設定を変更したりできます。
スクリプトの保存
レポートを再現するためのスクリプトを保存するオプションが、保存先ごとに用意されています。
Byグループのスクリプトを保存
By変数の全水準に対するレポートを再現するスクリプトを保存するオプションが、保存先ごとに用意されています。起動ウィンドウでBy変数を指定した場合のみ使用可能です。