公開日: 04/01/2021

欠測値をカテゴリとして扱う

[欠測値をカテゴリとして扱う]オプションをオンにすると、欠測値があっても予測値を求めることができるように、欠測値が処理されます。連続尺度の効果と、名義尺度や順序尺度などのカテゴリカルな効果に対して、以下で説明するような欠測値処理が行われます。

連続尺度の効果

連続尺度の主効果における欠測値に対しては、内部的に指示変数が作成されます。この指示変数は、欠測値の場合は1、欠測値でない場合は0となっています。また、元の欠測値には、非欠測値の平均値が代入されます。代入するのはどのような値でも良いのですが、平均値を代入するのは、非欠測値の平均値は一種の「中立的」な値で、パラメータ推定値が解釈しやすくなるからです。

こうして求められた指示変数のパラメータ推定値は、説明変数の平均値における、欠測値グループと非欠測値グループとの応答予測値の差を表しています。

多項式における2次以上の項でも、各変数の欠測値は、各変数の非欠測値の平均値に置き換えられます。なお、[多項式の中心化]がオンになっている場合は(デフォルトではオンになっています)、この平均値は0になります。なぜなら、[多項式の中心化]オプションがオンになっている場合、多項式の項における各変数は、平均を引くことにより中心化されているからです。

「効果の検定」レポートでは、欠測値のある連続尺度の主効果におけるパラメータ数は、2となります。そして、「パラメータの推定値」レポートにおいて、パラメータ名が、連続尺度の主効果は「<列名>(平均値補完)」、指示変数は「<列名>欠測値」となっています。データテーブルに保存される予測式は、これらのモデルパラメータを用いて、欠測値を考慮した計算式になっています。

カテゴリカルな効果

名義尺度または順序尺度の主効果に欠測値がある場合、その欠測値は、その因子における1つの水準として扱われます。このように扱われるため、「効果の検定」レポートにおけるパラメータ数は、1つ増えます。

「パラメータ推定値」レポートでは、名義尺度の効果のパラメータ名は、「<列名>[ ]」となります。また、順序尺度では、「<列名>[-x]」となります。ここで、「x」は、値の順序で最も先頭にある水準です。

連続尺度の効果と同じように、データテーブルに保存される予測式は、これらのモデルパラメータを用いて、欠測値を考慮した計算式になっています。

コーディングのテーブル

[標準最小2乗]の手法を使用している場合、[列の保存]>[コーディングのテーブルを保存]を選択することで、[欠測値をカテゴリとして扱う]オプションをオンにしたときに使用された計画行列を見ることができます。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).