「外れ値を調べる」プラットフォームの「K近傍法外れ値」レポートには、指定された値Kまでの、kの各値に対するプロットが描かれます。各プロットのkの値は、その縦軸のラベルに示されます。これは、「第K近傍点までの距離」という形式で表示されます。ここでKは、K番目に近い点を意味します。各プロットには、第i行目の点からK番目に近い近傍点までの距離がプロットされます。複数のkに対して近傍点からの距離が大きい点は、概して外れ値だと言えます。
プロットの上には以下のボタンがあります。
選択された行の除外
選択されている点に対応する行を、今後の分析から除外します。データテーブルでは、「除外」の行属性がこれらの行に割り当てられます。「K近傍法」レポートを再実行するか、それとも閉じるかを尋ねられます。分析を再実行すると、行を除外して新たに近傍点が計算されます。プロットは更新され、除外された点は表示されません。
散布図行列
分析対象のすべての列に対する散布図行列を含むウィンドウを別に開きます。「K近傍法」プロットで点を選択し、散布図行列でそれらの点を見ることで、外れ値であるかもしれない値を探索できます。
近傍距離の保存
各行からの距離を、データテーブルの新しい列としてn番目の最も近い近傍に保存します。
閉じる
「K近傍法」レポートを閉じます。
「K近傍法」レポートには、「近傍点からの外れ値」表も含まれています。この表には、K番目の近傍点からの距離が最大の20個のオブザベーションが含まれています。表には以下の列があります。
行
オブザベーションの行番号です。
距離
指定した行のオブザベーションからそのK番目の近傍点までの距離です。この表は、この列の降順に並べられています。
近傍点
k個の近傍点に対する行番号のリストです。最初の行番号が最も近い近傍点です。最後の行番号はK番目の近傍点で、このオブザベーションとその行との間の距離が「距離」列に示されています。
列<n>
対応するRMS値の列名です。
RMS<n>
各列のk個の近傍点における差の平均平方平方根。最大のRMS値から順番に表示されます。RMS1が最大のRMS値です。p番目のRMS値は次のように計算されます。
ここで
Dpはp番目の列です。
Dp,iはp番目の列のi行目の値です。
Dp,ikはk番目の近傍点に対するp番目の列のi行目の値です。
メモ: 「近傍点からの外れ値」表に表示されている「列」と「RMS」の列の数は、起動ウィンドウで指定した列の数、または5のどちらか小さいほうです。