多変量分析 > 階層型クラスター分析 > 階層型クラスター分析のオプション
公開日: 04/01/2021

階層型クラスター分析のオプション

「階層型クラスター分析」の赤い三角ボタンのメニューには、次のようなオプションがあります。

クラスターの色分け

所属しているクラスターに従って、樹形図のラベルや結合線を色分けします。また、データテーブルの行も色分けされます。クラスターの数を変更すると、色が更新されます。このオプションの選択を解除すると、クラスターの数を変更しても色は更新されません。

クラスターのマーカー分け

所属しているクラスターに従って、データテーブルの各行にマーカーをつけます。クラスターの数を変更すると、マーカーが更新されます。このオプションの選択を解除すると、クラスターの数を変更してもマーカーは更新されません。

クラスターの数

表示されたウィンドウにクラスター数を入力すると、樹形図上のひし形ハンドルの位置がそれに合わせて調整されます。

クラスター数の選択規準

各クラスター数に対して、立方体クラスター規準(CCC; Cubic Clustering Criterion)を計算します。CCCはクラスター数の推定値を計算するために使用されます。これは、距離をベースとする任意のクラスタリングアルゴリズムとともに使用できます。CCCの値が大きいほど、クラスターの数に関してあてはまりが良いことを示します。SAS Institute Inc.(1983)を参照してください。([データは距離行列]を選択した場合は表示されません。)

樹形図の表示

樹形図の表示/非表示を切り替えます。

樹形図のスケール

樹形図のスケールを設定する以下のようなオプションがあります。

距離スケール

樹形図を、距離に比例した長さで描きます。使用される距離は、起動ウィンドウで指定された距離です。水平方向の結合点間の長さが、距離に比例したものになります。これは「距離グラフ」で使用されるスケールと同じです。このオプションは、樹形図のデフォルトです。

等間隔

樹形図において、2つの結合点間の水平方向の長さを、等間隔で表示します。

幾何級数

樹形図において、2つの結合点間の水平方向の長さを、クラスター数だけに応じて設定します。このオプションは、データの行数が多いときに、小さなクラスターの部分を詳しく見たい場合に便利です。

距離グラフ

樹形図の下にある距離グラフの表示/非表示を切り替えます。

クラスター数ハンドルの表示

樹形図上で、クラスター数の変更に使うハンドルの表示/非表示を切り替えます。

選択した行にズーム

樹形図でクラスターを選択し、このオプションを選択すると、そのクラスターを中心に樹形図がズームされます。クラスターをダブルクリックしても、同様にズームされます。元の表示に戻すには[ズームの解除]を選択します。

ズームの解除

樹形図のズームを元に戻します。

選択したクラスターでピボット

選択したクラスターの下位にある2つのクラスターの順序を入れ替えます。

カラーマップ

各「Y, 列」変数を値によって色分けするカラーマップ(ヒートマップともいう)を追加するためのオプションを表示します。サブメニューには、色のパターンの選択肢があります。

変数間クラスター

行と同様に「Y, 列」に指定した変数もクラスタリングします。列の樹形図に加え、カラーマップも表示されます。通常、列の値は同じスケールで測定されていなければならず、[データの標準化]を選択してはいけません。([積み重ねたデータ]を選択した場合はこのオプションは表示されません。)

位置

樹形図のラベルなどの位置を変更するオプションを表示します。

凡例

カラーマップに使用されている色の凡例の表示/非表示を切り替えます。このオプションは、カラーマップが有効な場合のみ使用できます。

カラーマップに列の追加

指定された列のカラーマップを追加します。([要約したデータ][データは距離行列]、または[積み重ねたデータ]を選択した場合はこのオプションは表示されません。)

星座樹形図

階層クラスター分析の星座樹形図の表示/非表示を切り替えます。このグラフでは、個々のデータ行を端点、各クラスター結合を新しい点として表し、それらを線で結んでクラスターへの所属を表します。線の長さはクラスター間の距離を表し、線が長いほど、クラスター間の距離が離れていることを示します。

星座樹形図の線にマウスを置けば、長さが表示されます。ただし、長さは相対値です。軸のスケール、点の方向、線の角度は恣意的です。ノードの末端が離れたり、プロットが雑然としたものにならないように決定されます。これは大規模なデータセットで重要になります。

星座樹形図内を右クリックし、[ラベル表示]を選択解除すると、端点のラベルが表示されなくなります。

星座樹形図の保存

星座樹形図の座標をデータテーブルに保存します。([要約したデータ][データは距離行列]、または[積み重ねたデータ]を選択した場合はこのオプションは表示されません。)

クラスターの保存

クラスター番号を含むデータテーブル列を作成します。起動ウィンドウで[空間的な指標の計算]を選択した場合、クラスター番号は空間的な指標のデータテーブルにも保存されます。

最も近いクラスターの計算式を保存

新しいデータテーブル列を作成し、最も近いクラスターを求める計算式を保存します。このオプションは、各クラスターの重心までのユークリッド距離を計算し、その距離が最も近いクラスターを求めます。この計算式で求められるクラスターの割り当ては、「階層型クラスター分析」で求められるものとは必ずしも一致しません。クラスターの決定方法が異なるためです。ただし、かなり似通ったものとなります。([要約したデータ][データは距離行列]、または[積み重ねたデータ]を選択した場合はこのオプションは表示されません。)

表示順序の保存

樹形図内での行の順序を含むデータテーブル列を作成します。

クラスター階層の保存

スクリプトで樹形図を描くために必要な情報がデータテーブルに保存されます。結合ごとに、結合先・結合者・結果を表す3つの行が作成され、クラスター中心・サイズなどの情報が保存されます。

樹形図データの保存

JMPとSASでクラスター分析の樹形図を比較する場合に必要な情報をデータテーブルに保存します。結合ごとに、新しいクラスターにつき1行ずつ、クラスターサイズなどの情報が保存されます。

距離行列の保存

行間の距離を含んだデータテーブルを新たに作成します。

クラスター平均の保存

クラスターごとの行数(オブザベーション数)と平均を含んだデータテーブルを新たに作成します。

クラスターの要約

[データは距離行列]を選択した場合は表示されません。)以下の情報を表示します。

クラスター平均

クラスターごとの行数と平均を含んだ表です(ただし、積み重ねデータの場合は、行数ではなくて、「対象のID」の個数です)。

クラスター標準偏差

クラスターごとの行数と標準偏差を含んだ表です(ただし、積み重ねデータの場合は、行数ではなくて、「対象のID」の個数です)。

クラスター平均プロット

平均のパラレルプロットまたは2次元ヒートマップを表示します。

[積み重ねデータ]で「属性のID」列を2つ指定したとき以外は、パラレルプロットが表示されます。パラレルプロットでは、各変数の軸のスケールが次のように設定されます。

[データの標準化]を選択した場合、軸は平均±2標準偏差の範囲となります。この場合、標準偏差と平均は生データに対して計算されます。クラスター平均がこの範囲を超えた場合、軸の範囲は延長されます。

[データの標準化]を選択しなかった場合は、共通したスケールの縦軸が使われます。(このスケールはグラフビルダーの[スケールの統一]オプションと同じです。)

[積み重ねデータ]で「属性のID」列を2つ指定したときは、Y変数の平均を座標ごとに描いた2次元プロットが表示されます。このプロットは、[青->グレー->赤]のグラデーションによって、色付けされます。

列の要約

各変数に対して、その変数の変動のうちクラスターで説明される割合を表示します。この値は、クラスターを説明変数として分散分析をしたときのR2乗値(決定係数)です。このオプションでは、棒グラフも表示されます。

散布図行列

変数をすべて使用した散布図行列を作成します。([要約したデータ][データは距離行列]、または[積み重ねたデータ]を選択した場合はこのオプションは表示されません。)

パラレルプロット

クラスターごとにパラレルプロットを作成します。([要約したデータ][データは距離行列]、または[積み重ねたデータ]を選択した場合はこのオプションは表示されません。)軸のスケールは、クラスター平均プロットの場合と同様です。クラスター平均プロットを参照してください。

クラスター調整の処置比較

(Shiftキーを押しながら「階層型クラスター分析」の赤い三角ボタンをクリックした場合にのみこのオプションは表示されます。)1つの応答列と2水準の処置列を選択します。「クラスターで調整した平均の差」レポートが表示されます。

以下のオプションの詳細については、『JMPの使用法』ローカルデータフィルタ[やり直し]メニュー、および[スクリプトの保存]メニューを参照してください。

ローカルデータフィルタ

データをフィルタリングするためのローカルデータフィルタの表示/非表示を切り替えます。

やり直し

分析を繰り返したり、やり直したりするオプションを含みます。また、[自動再計算]オプションに対応しているプラットフォームにおいては、[自動再計算]オプションを選択すると、データテーブルに加えた変更が、該当するレポートに即座に反映されるようになります。

スクリプトの保存

レポートを再現するためのスクリプトを保存するオプションが、保存先ごとに用意されています。

Byグループのスクリプトを保存

By変数の全水準に対するレポートを再現するスクリプトを保存するオプションが、保存先ごとに用意されています。起動ウィンドウでBy変数を指定した場合のみ使用可能です。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).