「外れ値を調べる」プラットフォームの「ロバスト主成分分析による外れ値」レポートには、アルゴリズムに関する情報の表と、いくつかの結果の表が含まれています。最初の表には、低ランク行列のランク、特異値分解の反復回数、収束基準、Lambdaの値、および補完された欠測値の数が含まれています。[乱択特異値分解]オプションが有効になっている場合は、[乱択特異値分解]オプションで使用される次元数も要約表に含まれます。以下は、レポートに含まれている他の表です。
大きい残差のセル
列名と行番号で識別される、最大の外れ値オブザベーションを示す表です。表示されるオブザベーションの数は、外れ値の閾値によって決まります。この表には、オブザベーションの列名と行番号、残差、および標準化残差の値が含まれます。
ヒント: データテーブル内の特定の外れ値のセルに色をつけるには、「大きい残差のセル」表で行を選択し、[色をつける]をクリックします。
行の平均平方平方根
この表には、データテーブル内の各行の平均平方平方根値が表示されます。平均平方平方根は、標準化残差を使って計算されます。
ヒント: 「行の平均平方平方根」表で行を選択すると、それに対応する行がデータテーブルで選択されます。
列の平均平方平方根
この表には、起動ウィンドウで指定した各列の平均平方平方根値が表示されます。平均平方平方根は、標準化残差を使って計算されます。
ヒント: 「列の平均平方平方根」表で行を選択し、[列の選択]をクリックすると、それに対応する列がデータテーブルで選択されます。
スナップショット
データテーブル内にある外れ値のセルを表すグラフです。外れ値のセルには赤い色がついています。
残差
行列の分解で得られた残差の行列です。標準化残差の絶対値が次の値より大きい場合は、セルに色がつけられます。
min[0.99 × max{abs(residuals)}, 外れ値の閾値]
低ランク近似
行列の分解で得られた標準化残差の行列です。
特異値
特異値分解で得られた特異値のベクトルです。
「ロバスト主成分分析による外れ値」レポートの下部には、レポートのさまざまな部分を保存するためのボタンがあります。
閉じる
「ロバスト主成分分析による外れ値」レポートを閉じます。
大きい外れ値の保存
「大きい残差のセル」表内の情報を新しいデータテーブルに保存します。
綺麗にしたデータの保存
閾値に基づいて外れ値を整理し、新しい列をデータテーブルに保存するための手法を指定できるウィンドウが開きます。
トリム
外れ値のセルをトリムします。ただし、これは標準化残差の絶対値が指定した閾値より大きい場合です。デフォルトの閾値は10です。[色]を選択すると、外れ値のセルが赤く表示されます。トリムされたセルは、標準化されていない閾値に設定されます。
補完
外れ値のセルを低ランク近似の値に設定します。ただし、これは対応する標準化残差の絶対値が指定した閾値より大きい場合です。デフォルトの閾値は100です。[色]を選択すると、これらのセルが緑で表示されます。
欠測値に置換
外れ値のセルを欠測値に設定します。ただし、これは標準化残差の絶対値が指定した閾値より大きい場合です。デフォルトの閾値は1000です。[色]を選択すると、これらのセルが青で表示されます。
補完した欠測値に色をつける
このチェックボックスをオンにすると、欠測値が補完されたセルに色をつけることができます。
残差の保存
残差を元のデータテーブルの新しい列に保存します。
標準化残差の保存
標準化残差を元のデータテーブルの新しい列に保存します。
低ランク近似の保存
低ランク近似を元のデータテーブルの新しい列に保存します。