公開日: 09/19/2023

「局所的な平滑化」レポート

「二変量」プラットフォームの[ノンパラメトリックな曲線]>[カーネル平滑化]オプションは、局所的な重み付けを行う最小2乗法でモデルをあてはめます。いくつかの抽出された点に関して、局所的に重み付けて直線や2次曲線といった単純なモデルを次々にあてはめていくことにより、滑らかな曲線を求めます。最大で合計512個の局所的な回帰モデルが組み合わされ、データ全体にわたって滑らかな曲線が作成されます。この手法は、LOWESS(locally weighted scatterplot smoothing)とも呼ばれます。[カーネル平滑化]オプションでは、Cleveland(1979)の手法を使用しています。ただし、ほぼ完全なあてはめの場合は微調整を加えており、Clevelandの双加重関数の引数6 * q50を、max(6 * q50, 2 * q90)で置き換えています。ここで、q50は50パーセント点、q90は90パーセント点です。[局所的な平滑化]メニューのオプションについては、二変量の関係のオプションを参照してください。

「局所的な平滑化」レポートには、次のような列があります。

R2乗

データの全変動のうち、平滑化モデルによって説明されている割合。「平滑化スプライン曲線によるあてはめ」レポートの統計的詳細を参照してください。

誤差平方和(SSE)

各点からあてはめた曲線までの距離の平方和。これは、あてはめたモデルで説明できていない「誤差」(残差)を表します。

局所的なあてはめ(λ)

局所的なあてはめに使われる多項式の次数(λ)を指定します。

重み関数

重み関数を指定します。LOWESSモデルはトリキューブ(3次式の3乗)を使用します。このような重み付け関数は、局所的な回帰をあてはめていくときに、各点(xi, yi)が局所的な回帰に与える影響を決めます。

滑らかさ(α)

局所的なあてはめで対象となる点の数を指定します。値を入力するか、スライダーで調整します。αは平滑化パラメータと呼ばれ、0~1の値を取ります。αを大きくすると、曲線の滑らかさが増します。

標本抽出デルタ

計算に使われる標本の抽出率を指定することができます。デフォルトでは、標本抽出デルタはゼロであり、すべての点があてはめに使用されます。標本抽出デルタの値を大きくすると、直前の抽出点からデルタの範囲内にあるような点は抽出されなくなります。データの密度が高く、あてはめに使用する点の数を減らしたいような場合に、このオプションを使用してください。

ロバスト性

あてはめのロバスト性を指定することができます。反復のたびに重みを調整し、モデルから離れた点に小さな重みを与えることにより、外れ値による影響を小さくします。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).