公開日: 09/19/2023

ここに画像を表示モデルのレポート

データの前処理が終わったら、「関数データエクスプローラ」の赤い三角ボタンの「モデル」メニューにあるオプションでモデルをあてはめます。利用可能なモデルについては、モデルを参照してください。異なる種類のモデルをデータにあてはめるたびに、そのモデルの結果がレポートに追加されます。モデルに関する各レポートは、次のようなレポートで構成されます。

モデルの設定

モデル選択

診断プロット

関数の要約

係数

ランダム係数

関数主成分分析

ここに画像を表示モデルの設定

「モデルの設定」レポートでは、あてはめるモデルを指定します。指定されたいくつかのモデルの結果は「モデル選択」レポートで比較することができます。「モデルの設定」レポートで指定できる設定は、あてはめるモデルの種類によって異なります。ウェーブレットモデルでは、「モデルの設定」を使用できません。

B-スプラインモデルおよびP-スプラインモデルの設定

B-スプラインモデルおよびP-スプラインモデルをあてはめるときには、次の設定を指定できます。

節点の個数

スプライン曲線で用いる節点の個数を、追加・削除できます。また、追加する節点の個数を範囲で指定することもできます。節点はゼロ以外の整数でなければなりません。

メモ: B-スプラインモデルで指定できる節点の最大個数は、1関数における観測値の最大数または1関数における一意な入力値の個数から1を引いた数です。P-スプラインモデルで指定できる節点の最大個数は、1関数における一意な入力値の個数よりも2少ない数です。これらの最大個数よりも大きな数を指定すると、警告メッセージが表示されます。

スプライン次数

チェックボックスにより、「モデル選択」レポートから該当のスプライン次数の結果を追加・削除できます。

Fourier基底モデルの設定

Fourier基底モデルに対しては、次の設定を指定することができます。

Fourier基底ペアの個数

Fourier基底モデルにおける、正弦と余弦のペアの個数を追加・削除できます。また、追加するペアの個数を範囲で指定することもできます。

周期

関数の周期を変更します。

モデルの設定を指定後、[実行]をクリックすると、「モデル選択」レポートのモデルが更新されます。

ヒント: モデルをあてはめる前にモデルの設定を指定するには、Shiftキーを押しながら「関数データエクスプローラ」の赤い三角ボタンをクリックし、目的のモデルを選択します。モデルを参照してください。

ここに画像を表示モデル選択

「モデル選択」レポートには、全体的な予測プロット、グリッド形式の個々の予測プロット、モデル選択規準統計量のプロット、および表が表示されます。個々の予測プロットのグリッドは「データ処理」レポートにある個々のプロットのグリッドと同じレイアウトであり、矢印のボタンなど同様のコントロールがあります。一度に表示できるプロットの最大数は20個です。ドロップダウンメニューと矢印を使って、表示する個々の予測プロットのグループを変更できます。

予測プロットでは、データ値が点としてプロットされ、また予測値の曲線が描かれています。検証セットがある場合、検証セット内の関数の予測曲線は表示されません。全体の予測プロットに描かれている曲線は、複数の関数の予測値を平均したものです。個々の予測プロットに描かれている曲線は、各々の関数の予測値です。B-スプラインモデルに対する全体の予測プロットには、節点の位置も表示されます。この全体の予測プロットにおける垂直の青線をドラッグして移動することにより、節点の位置を変更できます。節点を新しい位置に移動したモデルのレポートに更新するには、[モデルの更新]ボタンをクリックします。節点をデフォルトの位置に戻すには、[節点のリセット]ボタンをクリックします。

ウェーブレットモデルの場合は、[係数]タブもあります。ウェーブレットモデルにおける[係数]タブには、全体的な係数プロットと個々の係数プロットのグリッドが含まれています。この係数プロットは、各解像度における係数の相対的な重要性が破線で描かれています。プロットされる破線は、入力変数の値(横軸)と解像度(縦軸)によって決まります。これらの数値は、「ウェーブレット係数」表の列名にあります。個々のプロット上の各線の色は、対応する係数の符号によって決まります。青は正の係数、赤は負の係数を示します。プロットの各破線の長さは、係数によって決まります。各破線の長さは、係数の最大値の絶対値によって尺度化された、係数の値になっています。したがって、最大となっている係数の破線が最も長く、係数が小さくなるにつれて線が短くなります。平均プロットの場合、係数は各関数で平均化されます。各破線の色と長さは、平均化および尺度化された係数によって決まります。

メモ: 係数プロットは、適合度が最良であるウェーブレットモデルに対してのみ表示されます。

モデル選択規準統計量のプロットと関連する表の外観は、モデルのタイプによって異なります。

B-スプラインモデルとP-スプラインモデル

これらのモデルの選択規準統計量のプロットでは、定義された数の節点に対して規準統計量がプロットされます。そして、スプライン次数ごとに、折れ線が描かれます。このプロットでは、デフォルトでBIC(ベイズ情報量規準; Bayesian Information Criterion)がプロットされます。モデルの赤い三角ボタンのメニューにある[モデル選択]を使用して、規準統計量を変更できます。現在選択されているモデルは、モデル選択規準統計量のプロットにおいて垂直の点線で示されています。デフォルトで選択されているスプラインの次数と節点の数は、モデル選択規準統計量が最小となっているモデルのものです。選択されているモデルを変更するには、垂直線の上部にあるスライダをドラッグするか、モデル選択規準統計量のプロットまたは凡例内で特定のスプラインをクリックします。これらの操作により、「モデル選択」レポートのプロットや情報が自動的に更新されます。

モデル選択規準統計量のプロットの下には、現在のモデルに関する情報を含む、「適合度統計量」表があります。ここには、節点数・スプライン次数・(-2)*対数尤度・AICc・BIC・GCV、および応答の標準偏差が表示されます。この「応答の標準偏差」は、現在のモデルにおける誤差の標準偏差(の推定値)です。P-スプラインモデルにおいては、ペナルティパラメータl (罰則パラメータであるラムダ)も表示されます。

Fourierモデル

Fourierモデルに対する選択規準統計量のプロットでは、Fourier基底ペアの個数に対してモデル選択規準統計量がプロットされます。このプロットでは、デフォルトでBIC(ベイズ情報量規準; Bayesian Information Criterion)がプロットされます。モデルの赤い三角ボタンのメニューにある[モデル選択]を使用して、規準統計量を変更できます。現在、選択されているモデルは、モデル選択規準統計量のプロットにおいて垂直の点線で示されています。デフォルトで選択されているモデルは、モデル選択規準統計量が最小となっているモデルです。垂直の点線をドラッグして移動すると、現在のモデルを変更できます。垂直の点線をドラッグして移動すると、「モデル選択」レポートのプロットや情報が自動的に更新されます。

モデル選択規準統計量のプロットの下には、現在のモデルに関する情報を含む、「適合度統計量」表があります。ここには、Fourier基底ペアの個数、(-2)*対数尤度・AICc・BIC・GCV、および応答の標準偏差の値が表示されます。この「応答の標準偏差」は、現在のモデルにおける誤差の標準偏差(の推定値)です。

ウェーブレットモデル

ウェーブレットモデルに対する選択規準統計量のプロットでは、モデル番号に対してモデル選択規準統計量がプロットされます。このプロットでは、デフォルトでBIC(ベイズ情報量規準; Bayesian Information Criterion)がプロットされます。モデルの赤い三角ボタンのメニューにある[モデル選択]を使用して、規準統計量を変更できます。現在、選択されているモデルは、モデル選択規準統計量のプロットにおいて垂直の点線で示されています。デフォルトで選択されているモデルは、モデル選択規準統計量が最小となっているモデルです。

モデル選択規準統計量のプロットの下の表には、モデル番号とモデル名、および現在のモデル選択が示されます。この表はモデル選択規準統計量の順に並べられており、適合度が最良であるモデルが一番上に表示されています。縦の点線の上部にあるスライダをドラッグするか、表でモデルを直接選択することで、モデルを選択できます。異なるモデルを選択すると、「モデル選択」レポートのプロットや情報が自動的に更新されます。

ここに画像を表示診断プロット

「診断プロット」としては、「予測値と実測値のプロット」と「予測値と残差のプロット」が表示されます。これらのプロットは、現在のモデルがデータにどの程度あてはまっているかを評価するのに役立ちます。「診断プロット」レポートは、デフォルトでは閉じています。

ここに画像を表示関数の要約

「関数の要約」レポートの「FPC」には、ID変数の各水準に対して、関数主成分(FPC; Functional Principal Component)の情報が表示されています。データ変動の1%以上を説明する主成分だけが、デフォルトで表示されます。平均・標準偏差・中央値(メディアン)・最小値・最大値・平均差・積分2乗誤差平方根(RISE; Root Integrated Square Error)・積分2乗関数平方根(RIFS; Root Integrated Function Square)も表示されます。平均差と積分2乗誤差平方根(RISE)の要約値は、ID特有の関数が全体的な平均値関数とどのくらい異なるかを判断するのに使用されます。積分2乗誤差平方根(RISE)は、IDごとの関数がどれぐらいばらついているかを表しています。「関数の要約」レポートの統計的詳細を参照してください。

「関数の要約」のオプション

「関数の要約」の赤い三角ボタンのメニューには、以下のオプションがあります。

関数の要約をカスタマイズ

「関数の要約」レポートに表示する、FPC(関数主成分; Functional Principal Component)の個数や、要約統計量の種類を選択するウィンドウが開きます。表示されるFPCの個数を指定すると、「関数主成分分析」レポートも更新されます。[グラフの保存]チェックボックスもあります。このチェックボックスを使って、各関数のグラフを[要約の保存]オプションで作成されたデータテーブルに含めるかどうかを指定できます。

メモ: B-スプライン・P-スプライン・Fourierで指定できる関数主成分(FPC)の最大数は10です。ウェーブレットモデルまたは直接関数主成分分析の場合、指定できる関数主成分の最大数は20です。

ヒント: 同様のレポートが複数ある場合、Ctrlをクリックして[関数の要約をカスタマイズ]を選択することにより、「関数の要約」レポートをすべてカスタマイズすることができます。

要約の保存

「関数の要約」レポートで表示されている要約統計量を新規作成されたデータテーブルに保存します。新規作成されたデータテーブルの名前は、あてはめられたモデルの種類を説明しています。このデータテーブルは、固有関数・平均・予測式・条件付き予測式を求める計算式列を含んでいます。また、「関数の要約をカスタマイズ」ウィンドウで[グラフの保存]オプションが選択されている場合は、生データと各関数へのモデルのあてはめを示したグラフのイメージを含む列もあります。このデータテーブルには、予測式や条件付き予測式を描くスクリプトが付随しています。予測式や条件付き予測式の計算式は、入力変数・ID変数・固有関数値の関数になっています。

ヒント: ウェーブレットモデルの場合、[要約の保存]オプションを使用して作成されたデータテーブルには、ウェーブレット係数も保存されます。

管理図ビルダー

管理図ビルダーを使用して、関数主成分を分析します。「関数の要約」表における関数主成分ごとに、個別のグラフと「限界の要約」表が作成されます。『品質と工程』の「管理図ビルダー」を参照してください。

ここに画像を表示係数

指定したモデルの係数推定値を表示します。

基底関数モデルの場合は、基底関数の係数に対する推定値とその標準偏差が表示されます。これらの係数はすべての水準のID変数にわたって共通であり、混合モデルの枠組みにおける固定効果に対する推定値です。係数の信頼区間と標準誤差を表示するには、テーブル内で右クリックし、[列]を選択します。

ウェーブレットモデルの場合は、ID変数の水準ごとに、推定されたウェーブレット係数が表示されます。ファザーウェーブレットの列と、残りの係数に関する一連の列があります。各係数列は、それぞれ対応する解像度と、入力変数の位置によって識別されます。係数表には、閾値処理(thresholding)によって求められたウェーブレット係数の疎の表現が含まれています(Donoho, 1995)。

ここに画像を表示ランダム係数

「ランダム係数」レポートには、関数ごとに各基底関数に対するランダム係数の推定値が表示されます。ランダム係数の推定値は、ID変数の水準ごとに計算され、混合モデルの枠組みにおける変量効果に対する推定値です。ウェーブレットモデルの場合、「ランダム係数」レポートは表示されません。

ここに画像を表示関数主成分分析

「関数主成分分析」レポートには、推定されたモデルに対する関数主成分分析の結果が表示されます。「関数主成分分析」レポートには、関数主成分(FPC; Functional Principal Component)の固有値が大きい方から順に記載されています。また、各FPCが説明する変動のパーセントおよび累積パーセントが、棒グラフと一緒に表示されます。平均関数のグラフと、各形状関数のグラフがあります。これらは固有関数の値です。

「関数主成分分析」レポートでモデル選択を行うと、特定の次元に対する関数主成分の結果を精査できます。関数主成分の次元数に対して、Bayes情報量規準(BIC)をプロットしたグラフが表示されます。このプロットには、関数主成分における現在の次元数が縦の点線で示されています。関数主成分の次元数が異なるモデルでも、情報量規準が同じぐらいになる可能性があります。そのため、モデル選択規準統計量のプロットにはゾーンが表示されます。これはBIC統計量に対する範囲を示すものです。緑のゾーンと黄色のゾーンがあります。緑のゾーンは、最小BICから最小BIC+4までの範囲、黄色のゾーンは、最小BIC+4から最小BIC+10までの範囲です。デフォルトでは、緑のゾーン内に位置しているもののなかで最小数の関数主成分を持つモデルが選択されます。関数主成分の次元数は、縦線をドラッグすることで変更できます。縦線をドラッグすると、「関数主成分分析」レポート内の他の情報も自動的に更新されます。

メモ: y軸のスケール全体よりも狭いゾーンは、プロット上に表示するのが難しい場合があります。その場合は、Y軸をズームインすると、ゾーンが見やすくなります。

直接関数主成分分析を実行した場合は、全体の予測プロットとグリッド形式の個々の予測プロットも表示されます。個々の予測プロットのグリッドは「データ処理」レポートにある個々のプロットのグリッドと同じレイアウトであり、矢印のボタンなど同様のコントロールがあります。一度に表示できるプロットの数は20個で、ドロップダウンメニューと矢印を使って、表示する個々の予測プロットのグループを変更できます。関数主成分の数を更新すると、予測プロットも自動的に更新されます。

予測プロットでは、データ値が点としてプロットされ、また予測値の曲線が描かれています。検証セットがある場合、検証セット内の関数の予測曲線は表示されません。全体の予測プロットに描かれている曲線は、指定された次元数の関数主成分で、複数の関数の予測値を平均したものです。個々の予測プロットに描かれている曲線は、指定された次元数の関数主成分での各関数の予測値です。

メモ: モデリングされる関数が1つだけの場合には、「関数主成分分析」レポートは表示されません。また、関数主成分分析を実行したけれど計算に失敗した場合、「関数主成分分析」レポートにはエラーメッセージが表示されます。

「関数主成分分析」の赤い三角ボタンのメニューには、以下のオプションがあります。

診断プロット

「予測値と実測値のプロット」と「予測値と残差のプロット」の表示と非表示を切り替えます。これらのプロットは、選択された次元数の関数主成分でモデルがデータにどの程度あてはまっているかを評価するのに役立ちます。

スコアプロット

関数主成分スコアのスコアプロットの表示/非表示を切り替えます。「スコアプロット」の各軸にどのFPCスコア(関数主成分スコア)をプロットするかは、[成分の選択]の下のリストで変更できます。FPCが1つしかない場合、関数主成分スコアは直線y = x上にプロットされ、成分を変更するためのリストは表示されません。スコアプロットは、他の関数とは異なった傾向をもつ関数を見つけ出すのに役立ちます。外れ値となっている点の関数は、他の関数とは異なった傾向になっている可能性があります。スコアプロット内の点を選択すると、関数主成分プロファイルがその関数のスコアに設定されます。

ヒント: スコアプロットの点の上にカーソルを置くと、ID変数のその水準に対する、あてはめた曲線の予測プロットが表示されます。

関数主成分プロファイル

関数主成分スコアの表示/非表示を切り替えます。関数主成分プロファイルには、入力変数の列と各関数主成分スコアの列が含まれます。目標関数が指定されている場合は、プロファイルグラフ上に追加のボタンオプションがあります。目標関数を最適化し、目標プロファイルの表示と非表示を切り替えることができます。[目標プロファイルの表示]をクリックすると、2つのプロファイルがレポートに追加表示されます。1つは目標関数からの差異を表し、もう1つは目標関数からの積分誤差を表します。「関数主成分プロファイル」の赤い三角ボタンのメニューの詳細については、『プロファイル機能』のプロファイルを参照してください。

ヒント: [リセット]ボタンを使用すると、プロファイルですべての関数主成分スコアを0にリセットできます。

関数主成分の次元数を変更

関数主成分分析に表示する関数主成分スコアの次元数を指定します。また、このオプションで関数主成分スコアの次元数を指定すると、「関数の要約」レポートが更新されます。平均モデルを表示するには、関数主成分の次元数を0に設定します。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).