「外れ値を調べる」プラットフォームには、一変量や多変量のデータで外れ値を識別、探索、および管理するためのオプションがあります。
「Probe.jmp」サンプルデータには、「9999」という外れ値を含む列がいくつかあります。数字の「9」は多くの業界で欠測値のコードとして使用されています。次の例は、「9」の羅列からなる最大値を含む列、VDP_PCOLL、VDP_PINNBASE、およびVDP_PINPBASEを選択し、これらの列に「欠測値のコード」列プロパティを追加します。その後、列を再スキャンします。新しいレポートでは、「9」を含んだ外れ値がなくなっています。
dt = Open( "$SAMPLE_DATA/Probe.jmp" );
obj = Explore Outliers(
Y(
:VDP_M1,
:VDP_M2,
:VDP_NBASE,
:VDP_NEMIT,
:VDP_NENBNI,
:VDP_NSINK,
:VDP_PBASE,
:VDP_PBL,
:VDP_PCOLL,
:VDP_PEMIT,
:VDP_PINNBASE,
:VDP_PINPBASE,
:VDP_PSINK,
:VDP_SICR
),
Quantile Range Outliers( 1 ),
Show only columns with outliers( 1 ),
);
obj << Add Highest Nines to Missing Value Codes( :VDP_PCOLL, :VDP_PINNBASE, :VDP_PINPBASE );
obj << Rescan;