多変量分析 > PLS回帰 > あてはめたモデルに対するオプション
公開日: 09/19/2023

あてはめたモデルに対するオプション

「PLS回帰」プラットフォームの推定結果に関するレポートのタイトルバーにある赤い三角ボタンをクリックすると、次のようなオプションが表示されます。

変動プロット

「Xの説明される変動(%)」と「Yの説明される変動(%)」の2つのプロットを表示します。これらのプロットは、各因子によってXおよびYの変動がどれぐらい説明されているかを表す積み重ねた棒グラフを表示します。

変数重要度のプロット

各X変数に対するVIP(Variable Importance for Projection; 射影における変数重要度)のグラフを表示します。VIPの数値は、「変数重要度表」に表示されます。変数重要度のプロットを参照してください。

変数重要度 vs 係数プロット

モデル係数に対して、VIPをプロットしたグラフを表示します。Y変数を選択することができます。選択すると、その選択された応答変数の点のみが表示されます。ラベル表示のオプションも用意されています。元のデータに対する係数のプロットと、中心化・尺度化されたデータに対する係数のプロットという2つのプロットが表示されます。変数重要度 vs 係数プロットを参照してください。

VIP閾値の設定

「変数重要度のプロット」・「変数重要度表」・「変数重要度 vs 係数プロット」の閾値レベルを設定します。

係数プロット

各X変数に対する各応答のモデル係数の重ね合わせプロットを表示します。Y変数を選択することができます。選択すると、その選択された応答変数の点のみが表示されます。元のデータに対する係数のプロットと、中心化・尺度化されたデータに対する係数のプロットという2つのプロットが表示されます。

負荷量プロット

各因子に対するX負荷量とY負荷量を表示します。XY、それぞれのプロットが表示されます。

負荷量散布図行列

X負荷量とY負荷量の散布図行列を表示します。

負荷量の相関図

X負荷量とY負荷量とを重ね合わせた散布図を、単一の散布図もしくは散布図行列で表示します。このオプションを選択した場合、プロットしたい因子の数を指定します。

因子を2つ指定すると、単一の散布図が表示されます。プロットの下で、軸を定義する2つの因子を選択します。右矢印ボタンをクリックすると、因子のさまざまな組み合わせを順番に表示させることができます。

因子を3つ以上指定した場合、指定した数までの因子の各ペアを描いた散布図行列が表示されます。

どちらの場合も、チェックボックスを使ってラベルを制御することができます。

X-Yスコアプロット

次の2つのオプションがあります。

直線のあてはめ

X-Yスコアプロット上で、点に対してあてはめた直線を表示または非表示にします。

信頼区間の表示

X-Yスコアプロット上で、直線の95%信頼区間を表示または非表示にします。

スコア散布図行列

Xスコアの散布図行列と、Yスコアの散布図行列を別々に表示します。各Xスコアの散布図行列には、95%信頼楕円が表示されます。この信頼楕円は、外れ値の検出に役立ちます。信頼楕円の詳細については、Xスコア散布図行列の信頼楕円の統計的詳細を参照してください。

距離プロット

次のプロットを表示します。

各観測値からXモデルまでの距離

各観測値からYモデルまでの距離

XモデルとYモデルの両方までの距離の散布図

良いモデルでは、モデルからXおよびYまでの距離が短くなり、最後の散布図において、原点(0,0)周りに点が分布します。これらの散布図では、XやYの外れ値を見つけられます。また、いくつかの点が他のデータから離れて分布している場合、それらの点には別の共通点があると考えられるので、別に分析した方がよいかもしれません。検証データが使用されている場合や、検証データとテストデータが使用されている場合は、学習データに対する結果とともに、それらのデータに対する結果も出力されます。

T2乗プロット

各データ行のT2統計量をプロットしたグラフを表示します。グラフには、それらに対する管理限界も描かれます。各データ行のT2統計量は、そのデータ行の因子スコアから計算されます。T2および管理限界の計算方法については、T2プロットの統計的詳細を参照してください。

診断プロット

モデルの適合度を評価する診断プロットを表示します。プロットの種類は、予測値と実測値、予測値と残差、行番号と残差、残差の正規分位点プロットの4つです。プロットは応答ごとに作成されます。検証データが使用されている場合や、検証データとテストデータが使用されている場合は、学習データに対する結果とともに、それらのデータに対する結果も出力されます。

プロファイル

各Y変数のプロファイルを表示します。

スペクトルプロファイル

プロファイルを表示します。このプロファイルでは、最初のセルに、すべての応答変数の値が描かれています。これにより、X変数における変化がY変数にどのように影響を与えるかを視覚的に確認できます。

列の保存

各種計算式と結果を保存するオプションがあります。

予測式の保存

計算式を含む列を、元のデータテーブルに新規作成します。各Y変数に対して、予測式を含む「予測式 <応答>」という列が作成されます。この予測式は、X変数の関数となっています。

予測値をXスコアの計算式として保存

計算式を含む列を、元のデータテーブルに新規作成します。各Y変数に対して、予測式を含む「予測式 <応答>」という列が作成されます。この予測式は、Xスコアの計算式の関数となっています。各Xスコアの計算式の列も、データテーブルに保存されます。

予測値の標準誤差の計算式を保存

計算式を含む列を、元のデータテーブルに新規作成します。各Y変数に対して、予測平均値の標準誤差の計算式を含む「予測値の標準誤差 <応答>」という列が作成されます。この計算式は、X変数の関数となっています。予測値と信頼限界の統計的詳細を参照してください。

平均の信頼限界の計算式を保存

計算式を含む列を、元のデータテーブルに新規作成します。各Y変数に対して、応答平均の下側および上側の信頼限界の列が作成されます。これは、Xスコアの計算式の関数です。新しい列は、「平均 <応答>の下側95%」および「平均 <応答>の上側95%」という名前になります。これらは、応答変数の平均に対する95%信頼区間です。予測値と信頼限界の統計的詳細を参照してください。

個別の信頼限界の計算式を保存

計算式を含む列を、元のデータテーブルに新規作成します。各Y変数に対して、個々の予測値の下側および上側の信頼限界の列が作成されます。これは、Xスコアの計算式の関数です。新しい列は、「個別 <応答>の下側95%」および「個別 <応答>の上側95%」という名前になります。これらは、Yの個々の値に対する95%信頼区間です。予測値と信頼限界の統計的詳細を参照してください。

スコアの計算式を保存

計算式を含む列を、元のデータテーブルに新規作成します。抽出された因子ごとに、Xスコア計算式を含む「Xスコア <N> 計算式」という列と、Yスコア計算式を含む「Yスコア <N> 計算式」という列が作成されます。Xスコア計算式はX変数の関数であり、Yスコア計算式はXスコア計算式の関数です。Xスコア計算式の列には「MDMCC」列プロパティがあり、「モデルに基づく多変量管理図」プラットフォームで使用できるようになっています。モデルに基づく多変量管理図を参照してください。計算式の詳細については、PLS回帰の統計的詳細を参照してください。

Y予測値の保存

元のデータテーブルに列を新規作成します。Y変数ごとに、Yの予測値を含む列が作成されます。

Y残差の保存

元のデータテーブルに列を新規作成します。Y変数ごとに、Yの残差を含む列が作成されます。

X予測値の保存

元のデータテーブルに列を新規作成します。X変数ごとに、Xの予測値を含む列が作成されます。

X残差の保存

元のデータテーブルに列を新規作成します。X変数ごとに、Xの残差を含む列が作成されます。

Xの説明される変動を保存

新しいデータテーブルを作成します。X変数ごとに、抽出された各因子で説明される変動の割合を含む列が作成されます。

Yの説明される変動を保存

新しいデータテーブルを作成します。Y変数ごとに、抽出された各因子で説明される変動の割合を含む列が作成されます。

スコアの保存

元のデータテーブルに列を新規作成します。抽出された因子ごとに、Xスコアを含む列とYスコアを含む列が作成されます。

負荷量の保存

2つの新しいデータテーブルを作成します。X変数の負荷量を含むデータテーブルと、Y変数の負荷量を含むデータテーブルが作成されます。

標準化したスコアを保存

元のデータテーブルに列を新規作成します。抽出された因子ごとに、X標準化スコアおよびY標準化スコアを含む列が作成されます。計算式の詳細については、標準化したスコアと負荷量の統計的詳細を参照してください。

標準化した負荷量を保存

2つの新しいデータテーブルを作成します。X変数の標準化負荷量を含むデータテーブルと、Y変数の標準化負荷量を含むデータテーブルが作成されます。計算式の詳細については、標準化したスコアと負荷量の統計的詳細を参照してください。

T2乗の保存

計算式を含む列を、元のデータテーブルに新規作成します。T2の計算式を含む列が作成されます。この計算式は、X変数の関数です。この列の値は、T2乗プロットにも使用されます。

T2乗をXスコアの計算式として保存

計算式を含む列を、元のデータテーブルに新規作成します。T2の計算式を含む列が作成されます。この計算式は、Xスコアの計算式の関数です。

距離の保存

元のデータテーブルに列を新規作成します。Xモデルまでの距離(DModX)とYモデルまでの距離(DModY)の列が作成されます。距離プロットに使用される値です。

距離をXスコアの計算式として保存

計算式を含む列を、元のデータテーブルに新規作成します。Xモデルまでの距離(DModX)とYモデルまでの距離(DModY)の列が作成されます。これらの計算式は、Xスコアの関数です。

X重みの保存

新しいデータテーブルを作成します。抽出された因子ごとに、X変数に対する重みを含む列が作成されます。

ここに画像を表示検証の保存

元のデータテーブルに列を新規作成します。この列には、データの各行が検証でどのように使用されたかを示す通し番号が含まれます。検証法として[保留]を使用した場合、この列は、各行が学習と検証のどちらに使用されたかを示します。[K分割]を使用した場合、この列は、各行が割り当てられたサブグループの番号を示します。

ここに画像を表示補完の保存

新しいデータテーブルを作成します。X変数とY変数における欠測値を補完したデータテーブルが作成されます。[検証]列が指定されている場合は、その[検証]列も含まれます。

ここに画像を表示予測式を発行

予測式を作成し、それらを「計算式デポ」プラットフォームの計算式列のスクリプトとして保存します。「計算式デポ」レポートが開いていない場合は、このオプションによって「計算式デポ」レポートが作成されます。『予測モデルおよび発展的なモデル』の計算式デポを参照してください。

ここに画像を表示スコアの計算式を発行

XとYのスコアを求める計算式を作成し、そのスコアの計算式列を生成するスクリプトを「計算式デポ」レポートに保存します。「計算式デポ」レポートが開いていない場合は、このオプションによって「計算式デポ」レポートが作成されます。『予測モデルおよび発展的なモデル』の計算式デポを参照してください。

あてはめの削除

メインのプラットフォームレポートからモデルのレポートを削除します。

VIPでモデルを作成

起動ウィンドウが開き、現在のモデルで使われている応答がYに、VIPの値が指定の閾値を超える変数だけがXに指定された起動ダイアログが呼び出されます。「中心化・尺度化されたデータに対する係数vs 変数重要度」レポート内のボタンと同様の役目を果たします。変数重要度 vs 係数プロットを参照してください。

保存されたXスコアによるモデルに基づく多変量管理図

各Xスコアの計算式を保存し、「モデルに基づく多変量管理図」起動ウィンドウを開きます。起動ウィンドウでは、スコアの計算式が工程列に割り当てられています。このウィンドウで、行程列の追加や削除、時点IDの追加、履歴データの最終行の指定を行えます。これらの設定を行ってから、[OK]をクリックしてください。『品質と工程』のモデルに基づく多変量管理図を参照してください。

予測値のプロファイル

「プロファイル」起動ウィンドウを開きます。このウィンドウには、指定したモデルのあてはめに対する各変数の予測式が表示されます。必要に応じて誤差因子や別の予測式を追加してから、[OK]をクリックします。『プロファイル機能』のプロファイルを参照してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).