公開日: 09/19/2023

欠測値をカテゴリとして扱う

「パーティション」プラットフォームの[欠測値をカテゴリとして扱う]オプションを使うと、説明変数における欠測値を1つのカテゴリとして扱うことができます。なお、このオプションを選択すると、分岐のときに、欠測値があるデータ行は、各分岐でランダムに割り振られるのではなく、確定的に取り扱われます。[欠測値をカテゴリとして扱う]オプションは起動ウィンドウにあり、デフォルトで選択されています。[欠測値をカテゴリとして扱う]オプションを選択した場合、カテゴリカルな説明変数と連続尺度の説明変数とでは扱われ方が異なります。

カテゴリカルな説明変数における欠測値は、その変数における1つのカテゴリとして分析に使われます。

連続尺度の説明変数における欠測値の処理では、まず、説明変数の非欠測値が並べ替えられます。そして、並べ替えられた値の最後尾に欠測値があるものとみなされ、最適な分岐が探索されます。次に、並べ替えられた値の先頭に欠測値があるものとみなされ、最適な分岐が探索されます。そして、いずれの分岐がより良いかが、対数価値によって判断されます。なお、最初の分岐での欠測値処理と同じ処理が、後続の分岐でも使われます。つまり、ある変数の欠測値が最後尾の値として最初に処理されたら、その変数の欠測値は後続の分岐でも最後尾の値として処理されます。先頭の値として最初に処理されていたら、後続の分岐でも先頭の値として処理されます。

[欠測値をカテゴリとして扱う]オプションが選択されていない場合、欠測値は以下のように取り扱われます。

欠測値がある変数を分岐変数として使用するときには、その変数の欠測値のある各行はそれぞれ分岐のいずれかの側に無作為に割り当てられます。

欠測値のある変数が分岐変数として初めて使用されると、「インピュート」列が要約レポートに追加され、補完の回数が示されます。その後、補完が行われるにつれ、「インピュート」列が更新されます。

メモ: 補完の回数は、欠測値を含む行の数より大きくなることがあります。補完は各分岐で発生するので、欠測値のある行が無作為に複数回割り当てられることがあるためです。欠測値のある行がいずれかの分岐に無作為に割り当てられるたびに、補完の回数が増加します。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).