多変量分析 > K Meansクラスター分析 > 「K Means法」レポート > 「K Means法 クラスター数=N」レポート
公開日: 09/19/2023

「K Means法 クラスター数=N」レポート

「K Meansクラスター分析」プラットフォームの「K Means法 クラスター数=N」レポートには、クラスターごとに以下の要約統計量が表示されます。

「クラスター要約」レポートには、クラスター番号、クラスターごとのオブザベーション数(データの行数)、および、反復計算が収束するまでにかかった反復回数が表示されます。

「クラスター平均」レポートには、クラスターごとに分けて算出された、各変数の平均が表示されます。

「クラスター標準偏差」レポートには、クラスターごとに分けて算出された、各変数の標準偏差が表示されます。

「K Means法 クラスター数=N」レポートのオプション

「K Means法 クラスター数=N」レポートの赤い三角ボタンのメニューには、以下のオプションが含まれます。

バイプロット

クラスターを色分けする凡例とともに、データの主成分のうち最初の2次元を軸にして点とクラスターをプロットします。円はクラスターの中心の周囲に描かれ、円の大きさは各クラスターの度数に比例します。陰影が付けられた領域は、平均を中心とした密度の等高線です。デフォルトでは、各クラスター内においてオブザベーション90%が含まれる領域を示しています(Mardia et al. 1980)。プロットの下のリストを使用すれば、第1主成分と第2主成分以外をプロットすることができます。また、矢印ボタンによって、可能な軸の組み合わせをすべて繰り返して表示することもできます。プロットの下には、クラスターの色をデータテーブルに保存するオプションもあります。色をテーブルに保存を参照してください。固有値は降順に表示されています。

メモ: 起動ウィンドウで[列ごとに標準化]にチェックを入れた場合、バイプロットは相関行列を使用します。[列ごとに標準化]にチェックを入れなかった場合、バイプロットは共分散行列を使用します。

バイプロットオプション

バイプロットの外観をコントロールするための次のようなオプションがあります。

バイプロット線の表示

バイプロット線を表示します。ラベルの付いたバイプロット線は、主成分を基底とした部分空間における変数の方向を示します。バイプロット線は、各変数の各主成分に対する関連の度合を示します。

バイプロット線の位置

バイプロット線の位置と半径のスケールを指定できます。デフォルトでは、点(0,0)を出発点とします。プロットでバイプロット線をドラッグして移動するか、またはこのオプションによって出発点の座標を指定できます。半径のスケールオプションを使ってバイプロット線のスケールを調整し、バイプロット線を見やすくすることもできます。

バイプロットの密度等高線

密度等高線の信頼水準を指定できます。デフォルトの信頼水準は90%です。

クラスターのマーカー分け

データテーブルの各行に、クラスターに応じたマーカーをつけます。

三次元バイプロット

データの3次元バイプロットを表示します。分析に用いた変数が3変数以上の場合のみ使用できます。

パラレルプロット

クラスターごとにパラレルプロットを作成します。オプションで、プロットにおけるデータや平均の表示/非表示を切り替えることができます。『グラフ機能』のパラレルプロットを参照してください。

散布図行列

Y変数をすべて使用した散布図行列の表示/非表示を切り替えます。各散布図には、現在のクラスター数の確率楕円が含まれます。

SOMヒートマップ

(自己組織化マップでのみ使用可能。)自己組織化マップ(SOM)のクラスター平均を描いたヒートマップの表示/非表示を切り替えます。このグラフは、自己組織化マップで使用されたY変数の1つにおける平均で色付けされたヒートマップです。「ヒートマップの色を決める列」のメニューを使って、Y変数を変更できます。

メモ: ヒートマップ上のクラスターは、上から下、右から左という順番で配置されます。したがって、最初のクラスターは右上に、最後のクラスターは左下に配置されます。

色をテーブルに保存

データテーブルの各行に、クラスターに応じたマーカーをつけます。レポートウィンドウに「バイプロット」がある場合、データテーブルに保存された色は、バイプロットのクラスターの色と一致します。バイプロットで色が変更され、「色をテーブルに保存」オプションが再び選択された場合、データテーブルにおける行の色はバイプロットと一致するように更新されます。

メモ: 以下のいずれかの保存オプションを選択すると、保存された列の[ノート]列プロパティに、そのクラスター数が記録されます。この情報により、異なるクラスターのあてはめから保存オプションを使用して列を複数保存した場合でも、それぞれがどのあてはめのものなのかわかるようになっています。

クラスターの保存

データテーブルに次の2つの列を保存します。

各行に割り振られたクラスターの番号を含む「クラスター」列。

([自己組織化マップ]を選択した場合は使用不可。)各オブザベーション(各データ行)の、それが属するクラスターの平均までののユークリッド距離を2乗した値を含む「距離」列。まず、変数ごとに、オブザベーションとクラスター平均との差を、その変数全体の標準偏差で割ります。これらの標準化した差から変数全体の2乗和を求めます。

クラスター距離の保存

([自己組織化マップ]を選択した場合は使用不可。)「距離」列をデータテーブルに保存します。この列は、「クラスターの保存」オプションで得られる「距離」列と同じです。

SOMグリッドの保存

(自己組織化マップでのみ使用可能。)データテーブルに新しい列を保存します。この列には、各データについて最も近いクラスターを示す、SOMグリッドの行と列の番号が保存されます。

クラスター計算式の保存

「クラスター計算式」という計算式列をデータテーブルに保存します。この計算式は、どのクラスターに属するかを求めるものになっています。

距離計算式の保存

([自己組織化マップ]を選択した場合は使用不可。)「距離計算式」と呼ばれる計算式の列をデータテーブルに保存します。これは、割り付けられたクラスターの平均までの距離を2乗した値を計算する式です。

K個のクラスター距離の保存

([自己組織化マップ]を選択した場合は使用不可。)それぞれのクラスターの中心までの距離を2乗した値を含むk列を保存します。

K個の距離計算式の保存

([自己組織化マップ]を選択した場合は使用不可。)それぞれのクラスターの中心までのユークリッド距離を2乗した値を求める計算式を含むk列を保存します。

クラスター計算式の発行

「クラスター計算式の保存」オプションで使用されるのと同じスクリプトを「計算式デポ」に発行します。

クラスターのシミュレーション

クラスターの平均と標準偏差の推定値を使って乱数シミュレーションしたデータを含む、新しいデータテーブルを作成します。

削除

クラスター分析のレポートを削除します。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).