カーネル平滑化

基本的な統計分析 > 二変量分析 > ノンパラメトリックな曲線 > カーネル平滑化

公開日: 04/01/2021

カーネル平滑化

［カーネル平滑化］オプションは、幾つかの抽出された点に関して、局所的に重み付けて直線や2次曲線といった単純なモデルを次々にあてはめていくことにより、全体の曲線を求めます。最大で合計128個の局所的な回帰モデルが組み合わされ、データ全体にわたって滑らかな曲線が作成されます。この局所的に重み付けた回帰は、loess、もしくは、提案された当初の名前であるlowessとも呼ばれています。Lowessという呼び名は、locally weighted scatterplot smoother (局所重み付き散布図平滑化）が由来です。Cleveland（1979）を参照してください。

この手法は、変数間の関係を特定して、その後に必要な分析やモデル式を考察するのに役立ちます。

［局所的な平滑化］メニューのオプションについては、あてはめ用メニューを参照してください。

「局所的な平滑化」レポート

「局所的な平滑化」レポートには、「R2乗」と「誤差平方和(SSE)」が表示されます。これらの値は、平滑化曲線をその他のモデルや別の平滑化曲線と比較するのに役立ちます。

R2乗

データの全変動のうち、平滑化モデルによって説明されている割合。「平滑化スプライン曲線によるあてはめ」レポートを参照してください。

誤差平方和（SSE）

各点からあてはめた曲線までの距離の平方和。これは、あてはめたモデルで説明できていない「誤差」（残差）を表します。

局所的なあてはめ(λ)

個々の局所的なあてはめに対し、多項式の次数を選択します。2次多項式を使用すると、局所的なでこぼこが滑らかになります。λは、この手法であてはめる多項式の次数を表します。λには、0次（平均）、1次（線形）、または2次を指定できます。

重み関数

それぞれの局所的な回帰において、近傍のデータをどのように重み付けするかを指定します。デフォルトでは、重み付けの関数として、トリキューブ（3次式の3乗）が使われます。このような重み付け関数は、局所的な回帰をあてはめていくときに、各点（xi, yi）が局所的な回帰に与える影響を決めます。重みは、xからxiまでの距離が大きくなるにつれて小さくなり、やがてゼロになります。

滑らかさ(α)

個々の局所的なあてはめを構成する点の数を指定します。スライダーで値を調整するか、値を直接入力します。αは、平滑化パラメータで、正の数値なら何でもかまいませんが、通常は0.25～1の値を使用します。αを大きくすると、曲線の滑らかさが増します。

標本抽出デルタ

あてはめで使用する標本抽出の量を調整します。デフォルトでは、標本抽出デルタはゼロであり、すべての点があてはめに使用されます。標本抽出デルタの値を大きくすると、直前の抽出点からデルタの範囲内にあるような点は抽出されなくなります。データの密度が高く、あてはめに使用する点の数を減らしたいような場合に、このオプションを使用してください。

ロバスト性

モデルから離れた点に小さな重みを与えることにより、外れ値による影響を小さくします。ここには、重みを再計算する計算過程の反復回数（パスの回数）を指定します。この反復計算の目的は、外れ値に対する重みを小さくすることで、自動的に外れ値をなくすことです。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).