モデル化に関するユーティリティとして、データクリーニングや前処理の機能が用意されています。これらの機能は、データを探索したり、データの理解を深めたりするのに役立ちます。以下のような機能が用意されています。
• 一変量や多変量における外れ値を調べる。
• データの欠測値を探索し、補完する。
• データ内の異常な特徴やパターン探索・検索する。
図20.1 多変量のk近傍法外れ値の例