「正規混合 クラスター数=N」レポートには、クラスターごとに要約統計量が表示されます。
• 「クラスター要約」レポートには、クラスター番号、クラスターごとのオブザベーション数(データの行数)、および、割合が表示されます。
• 「クラスター平均」レポートには、クラスターごとに分けて算出された、各変数の平均が表示されます。
• 「クラスター標準偏差」レポートには、クラスターごとに分けて算出された、各変数の標準偏差が表示されます。
• その下の表には、(-1)*対数尤度、BIC、AICcが表示されます。『基本的な回帰モデル』の尤度・AICc・BICを参照してください。
• 「正規混合分布の相関」レポートには、クラスターごとの相関行列の推定値が表示されます。
「正規混合 クラスター数=N」レポートにはそれぞれ赤い三角ボタンのメニューがあり、以下のオプションが含まれます。
バイプロット
クラスターを色分けする凡例とともに、データの主成分のうち最初の2次元を軸にして点とクラスターをプロットします。円はクラスターの中心の周囲に描かれ、円の大きさは各クラスターの度数に比例します。陰影が付けられた領域は、平均を中心とした密度の等高線です。デフォルトでは、各クラスター内においてオブザベーション90%が含まれる領域を示しています(Mardia et al. 1980)。プロットの下のリストを使用すれば、第1主成分と第2主成分以外をプロットすることができます。また、矢印ボタンによって、可能な軸の組み合わせをすべて繰り返して表示することもできます。プロットの下には、クラスターの色をデータテーブルに保存するオプションもあります。色をテーブルに保存を参照してください。固有値は降順に表示されています。
メモ: このバイプロットは、常に相関行列に対する主成分分析に基づいて描かれます。
バイプロットオプション
バイプロットの外観をコントロールするためのオプションがあります。
バイプロット線の表示
バイプロット線を表示します。ラベルの付いたバイプロット線は、主成分を基底とした部分空間における変数の方向を示します。バイプロット線は、各変数の各主成分に対する関連の度合を示します。
バイプロット線の位置
バイプロット線の位置と半径のスケールを指定できます。デフォルトでは、点(0,0)を出発点とします。プロットでバイプロット線をドラッグして移動するか、またはこのオプションによって出発点の座標を指定できます。半径のスケールオプションを使ってバイプロット線のスケールを調整し、バイプロット線を見やすくすることもできます。
バイプロットの密度等高線
密度等高線の信頼水準を指定できます。デフォルトの信頼水準は90%です。
クラスターのマーカー分け
データテーブルの各行に、クラスターに応じたマーカーをつけます。
三次元バイプロット
データの3次元バイプロットを表示します。分析に用いた変数が3変数以上の場合のみ使用できます。
パラレルプロット
クラスターごとにパラレルプロットを作成します。オプションで、プロットにおけるデータや平均の表示/非表示を切り替えることができます。『グラフ機能』のパラレルプロットを参照してください。
散布図行列
Y変数をすべて使用した散布図行列を作成します。
色をテーブルに保存
データテーブルの各行に、クラスターに応じたマーカーをつけます。レポートウィンドウに「バイプロット」がある場合、データテーブルに保存された色は、バイプロットのクラスターの色と一致します。バイプロットで色が変更され、「色をテーブルに保存」オプションが再び選択された場合、データテーブルにおける行の色はバイプロットと一致するように更新されます。
メモ: 以下のいずれかの保存オプションを選択すると、保存された列の[ノート]列プロパティに、そのクラスター数が記録されます。この情報により、異なるクラスターのあてはめから保存オプションを使用して列を複数保存した場合でも、それぞれがどのあてはめのものなのかわかるようになっています。
クラスターの保存
各行に割り振られたクラスターの番号を含む「クラスター」という名前の列を、データテーブルに追加します。正規混合分布法の場合、所属する確率の最も高いクラスターが保存されます。
クラスター計算式の保存
「クラスター計算式」という計算式列をデータテーブルに追加します。この計算式は、どのクラスターに属するかを求めるものになっています。
クラスター計算式の発行
「クラスター計算式の保存」オプションで使用されるのと同じスコアコードを「計算式デポ」に発行します。「クラスター計算式の発行」を選び、かつ「計算式デポ」内部のモデルから「スクリプトの実行」を選ぶことによりデータテーブルに保存される列は、「クラスター計算式の保存」によって保存される数値と同じです。
混合確率の保存
クラスターごとに「確率クラスター<k>」という名前の列を追加して、オブザベーションがそのクラスターに属する確率を保存します。
混合計算式の保存
混合確率を計算する計算式を含む列を、データテーブルに追加します。除外したデータや新たに追加したデータの確率を求めたいときに、この計算式を使用できます。
距離の計算式 <k>
オブザベーションで評価されたクラスター<k>の多変量正規密度関数の推定値。
距離合計
距離を合計したものを計算する計算式の列。この列の計算式は、[密度関数の保存]オプションによって作成される「混合密度」列の計算式と同じです。
確率の計算式 <k>
オブザベーションがクラスター<k>に属する確率。これらの列には、[混合確率の保存]オプションによって作成される「確率クラスター<k>」列と同じ値を求める計算式が保存されます。混合確率を計算する計算式は次のとおりです。
密度関数の保存
正規混合分布の密度関数の推定値を含む「混合密度」という列を、データテーブルに追加します。
クラスターのシミュレーション
混合密度に基づいて、乱数データを生成します。正規分布から生成された数値データとそれらが属するクラスターを、新しいデータテーブルに保存します。
削除
クラスター分析のレポートを削除します。