正準プロットでは、[X, カテゴリ]列から作成されるダミー変数(指示変数)の線形結合と、 共変量の線形結合との相関が最大になるようなスコアが求められます。そうやって求められた共変量の線形結合(正準スコア)がプロットされます。このようにして求められた正準スコアは、グループ間の距離が最大となっています。
第1次元の正準スコアは、グループ(カテゴリ)から作成されたダミー変数の線形結合と、共変量の線形結合との相関が最大化となるときの、共変量の線形結合です。第2次元では、第1次元の正準スコアと直交するという条件のもとで、やはり相関が最大になるような線形結合が求められます。[X, カテゴリ]の列における水準がk個の場合は、k - 1次元の正準スコアが求められます。
図5.9 「Iris.jmp」の正準プロット
バイプロットの横軸と縦軸は、最初の2つの正準変数です。これらの正準変数は、グループ間の距離が最大となる2次元です。各正準変数はそれぞれ共変量の線形結合です (第 “正準構造”を参照)。このバイプロットを見ると、各オブザベーションがどのように分布しているかや、各共変量が正準変数にどのように寄与しているかがわかります。
–
|
共変量の線形結合(正準変数)の係数は、正準空間を構成するための「重み」と解釈できます。
|
–
|
この重みを解釈しやすくするために、各共変量は平均が0、標準偏差が1に標準化されます。標準化された共変量に対する係数は、正準重み(canonical weight)と呼ばれています。正準重みが大きいほど、その共変量と正準変数との関係が大きいことを示します。
|
–
|
重みの数値を知るには、赤い三角ボタンのメニューから[正準オプション]>[正準の詳細を表示]を選択してください。そして、「正準の詳細」レポートの最下部で「標準化スコア係数」を開いてください。詳細は、第 “標準化スコア係数”の節を参照してください。
|
•
|
95%信頼楕円の表示/非表示は、[正準オプション]>[平均の信頼限界楕円の表示]で切り替えます。
|
•
|
バイプロット線の表示/非表示は、[正準オプション]>[バイプロット線の表示]で切り替えます。
|
•
|
バイプロット線の中心は、ドラッグして別の位置へ移動することができます。バイプロット線の位置およびスケールを指定するには、赤い三角ボタンのメニューから[正準オプション]>[パイプロット線の位置]を選択します。正準プロットに表示されるデフォルトの半径のスケールは、調整しないとバイプロット線が見えない場合を除き、1.5です。
|
•
|
50%等高線の表示/非表示は、[正準オプション]>[正規50%等高線の表示]で切り替えます。
|
•
|
楕円と一致するように点を色分けするには、赤い三角ボタンのメニューから[正準オプション]>[プロット点の色分け]を選択します。
|
「Iris.jmp」データの場合は3つの「種類」があるので、正準変数は2つだけです。「Iris.jmp」の正準プロットのプロットを見ると、2つの正準変数で3つのグループがいい具合に分かれていることがわかります。
•
|
「花弁の長さ」は、「正準1」と正の関連性があり、「正準2」と負の関連性があります。「正準2」よりも「正準1」の定義における重みのほうが大きいです。
|
•
|
「花弁の幅」は、「正準1」と「正準2」の両方に正の関連性があります。両正準変数の定義における重みは同じくらいです。
|
•
|
「がくの幅」は、「正準1」と負の関連性があり、「正準2」と正の関連性があります。「正準1」よりも「正準2」の定義における重みのほうが大きいです。
|
•
|
「がくの長さ」は、「正準1」と負の関連性があり、「正準2」との関連性はほとんどありません。
|
「Fitness.jmp」の正準プロットは、「Fitness.jmp」サンプルデータの正準プロットです。被験者をM(男性)とF(女性)のカテゴリに分類するために、7つの連続変数が使用されます。分類変数には2つのカテゴリしかないので、正準変数は1つだけです。
図5.10 「Fitness.jmp」の正準プロット
「Fitness.jmp」の正準プロットの点は、「性別」で色分けされています。2つのグループが「正準1」の値ではっきりと分かれていることに注目してください。
•
|
•
|
•
|
「酸素摂取量」は「正準1」と負の関連性があります。
|