モデル化に関するユーティリティとして、データクリーニングや前処理の機能が用意されています。これらの機能は、データを探索したり、データの理解を深めたりするのに役立ちます。以下のような機能が用意されています。
• 一変量や多変量における外れ値を調べる。
• データの欠測値を探索し、補完する。
• データ内の、通常と異なる特徴やパターンを探索・発見する。
図21.1 多変量のk近傍法外れ値の例