この例では、米国全土に16箇所設置された測候所から収集した週ごとの気象データを分析します。データテーブルの「測候所の位置」スクリプトを実行すると、測定位置の地図が描かれます。1日ごとに記録された温度が、週ごとに要約されています。なお、すべての測候所で、気温の要約値が年間を通じて毎週あるわけではありません。つまり、ここで用いるデータは、疎な関数データです。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Functional Data」フォルダにある「Weekly Weather Data.jmp」を開きます。
2. [分析]>[発展的なモデル]>[関数データエクスプローラ]を選択します。
3. 「最高気温」を選択し、[Y, 出力]をクリックします。
4. 「週番号」を選択して、[X, 入力]をクリックします。
5. 「名前」を選択して、[ID, 関数]をクリックします。
6. [OK]をクリックします。
図15.2 最初に表示される「関数データエクスプローラ」レポート
最初に表示される「関数データエクスプローラ」レポートには、生データのプロット、要約統計量、関数平均のプロット、関数標準偏差のプロットが含まれています。データの前処理に関するオプションのボタンもあります。データの前処理に関するオプションは、[データ処理]の赤い三角ボタンのメニューからも実行することができます。モデル化する前の前処理として、出力データを標準化しましょう。
7. [変換]メニューの[標準化]ボタンをクリックします。
データのプロットと要約統計量は、指定された変換に基づいて更新されます。前処理として適用した「標準化」は、[ステップ]リストに記録されます。
8. 「関数データエクスプローラ」の赤い三角ボタンをクリックして、[モデル]>[Fourier基底]を選択します。
図15.3 「Fourier基底モデル」レポート
「Fourier基底」レポートには、選択されたモデルに関する情報を含む複数のレポートが含まれています。「モデル選択」レポートのプロットを見ると、現在、デフォルトで表示されたモデルは、BICが最小となっていることが分かります。気象データについては、BICにより選択されたFourier基底モデルには、最も長い周期は53であり、3つの基底関数ペアがあります。この選択されたモデルに関する適合度統計量や係数も表示されています。下にスクロールして、「関数主成分分析」レポートを表示します。
図15.4 「関数主成分分析」レポート
「関数主成分分析」レポートでは、データの変動のほぼ99%が3つの関数主成分で説明でき、最初の関数主成分だけで92%が説明できます。スコアプロットにおいては、他の関数とは傾向が異なる関数を見つけ出すことができます。このスコアプロットでは、米国のフロリダ州マイアミとメイン州グリーンヴィルのメイン林業サービスだけがやや外れ値となっています。個々の関数プロットにスクロールします。マイアミビーチの関数は平坦で、他の場所より気温の変動が少ないことを示しています。メイン州グリーンヴィルの関数は他の場所より最大値が小さく、常に気温が低いことを示しています。
ヒント: 「スコアプロット」レポートにおける[変数のラベルを表示]チェックボックスのチェックを外すと、外れ値となっている点がより見やすくなります。