多変量分析 > 階層型クラスター分析 > 「階層型クラスター分析」プラットフォームのオプション
公開日: 09/19/2023

「階層型クラスター分析」プラットフォームのオプション

「階層型クラスター分析」の赤い三角ボタンのメニューには、次のようなオプションがあります。

クラスターの色分け

所属しているクラスターに従って、樹形図のラベルや結合線を色分けします。また、データテーブルの行も色分けされます。クラスターの数を変更すると、色が更新されます。このオプションの選択を解除すると、クラスターの数を変更しても色は更新されません。

クラスターのマーカー分け

所属しているクラスターに従って、データテーブルの各行にマーカーをつけます。クラスターの数を変更すると、マーカーが更新されます。このオプションの選択を解除すると、クラスターの数を変更してもマーカーは更新されません。

クラスターの数

行クラスターの数を指定すると、樹形図上のひし形ハンドルの位置がそれに合わせて調整されます。

クラスター数の選択規準

(「データ形式」で[データは距離行列]を選択した場合は表示されません。)行クラスターに対する、クラスター数ごとの立方体クラスター規準(CCC)を表として出力します。CCCはクラスター数の推定値を計算するために使用されます。これは、距離をベースとする任意のクラスタリングアルゴリズムとともに使用できます。CCCの値が大きいほど、クラスターの数に関してあてはまりが良いことを示します。SAS Institute Inc.(1983)を参照してください。

樹形図の表示

樹形図の表示/非表示を切り替えます。

樹形図のスケール

樹形図のスケールを設定する以下のようなオプションがあります。

距離スケール

樹形図を、距離に比例した長さで描きます。使用される距離は、起動ウィンドウで指定された距離です。水平方向の結合点間の長さが、距離に比例したものになります。これは「距離グラフ」で使用されるスケールと同じです。このオプションは、樹形図のデフォルトです。

等間隔

樹形図において、2つの結合点間の水平方向の長さを、等間隔で表示します。

幾何級数

樹形図において、2つの結合点間の水平方向の長さを、クラスター数だけに応じて設定します。このオプションは、データの行数が多いときに、小さなクラスターの部分を詳しく見たい場合に便利です。

距離グラフ

樹形図の下にある距離グラフの表示/非表示を切り替えます。

クラスター数ハンドルの表示

樹形図上で、クラスター数の変更に使うハンドルの表示/非表示を切り替えます。

選択した行にズーム

樹形図でクラスターを選択し、このオプションを選択すると、そのクラスターを中心に樹形図がズームされます。クラスターをダブルクリックしても、同様にズームされます。元の表示に戻すには[ズームの解除]を選択します。

ズームの解除

樹形図のズームを元に戻します。

選択したクラスターでピボット

選択したクラスターの下位にある2つのクラスターの順序を入れ替えます。

位置

樹形図のラベルなどの位置を変更するオプションを表示します。

カラーマップ

各「Y, 列」変数を値によって色分けするカラーマップ(ヒートマップともいう)を追加できます。サブメニューには、色のパターンの選択肢があります。カラーマップを削除するには、[カラーマップ]>[なし]を選択します。

カラーマップに列の追加

(「データ形式」で[通常のデータ]を選択した場合のみ使用可能。)指定された列のカラーマップを追加します。

凡例

カラーマップに使用されている色の凡例の表示/非表示を切り替えます。指定した列ごとに凡例が表示されます。このオプションは、カラーマップが有効な場合のみ使用できます。

メモ: 列数が400を超える場合は、標準化したスコアに基づき、カラーマップで使用された色の凡例が1つだけ表示されます。

変数間クラスター

(「データ形式」で[通常のデータ]または[要約したデータ]を選択した場合のみ使用可能。)指定した列と行の両方でクラスタリングします。行のクラスターの樹形図のほか、Y変数の樹形図とカラーマップも表示されます。通常、列の値は同じスケールで測定されていなければならず、データを標準化しないことが前提となります。

列に対するクラスター分析

([変数間クラスター]を使用する場合のみ使用可能。)変数間クラスターのオプションが含まれます。

列クラスターの数

列クラスターの数を指定します。

列クラスター数の選択規準

列クラスターに対する、クラスター数ごとの立方体クラスター規準(CCC)を表として出力します。CCCはクラスター数の推定値を計算するために使用されます。これは、距離をベースとする任意のクラスタリングアルゴリズムとともに使用できます。CCCの値が大きいほど、クラスターの数に関してあてはまりが良いことを示します。SAS Institute Inc.(1983)を参照してください。

列クラスターの保存

新しいデータテーブルに列クラスターの情報を保存します。

クラスターの保存

新しいデータテーブルにクラスターの情報を保存します。起動ウィンドウで[空間的な指標の計算]を選択した場合、クラスター番号は空間的な指標のデータテーブルにも保存されます。

クラスター平均の保存

クラスターごとの行数(オブザベーション数)と平均を含んだデータテーブルを新たに作成します。

その他の情報の保存

その他の保存オプションのサブメニューを表示します。

最も近いクラスターの計算式を保存

新しいデータテーブル列を作成し、最も近いクラスターを求める計算式を保存します。このオプションは、各クラスターの重心までのユークリッド距離を計算し、その距離が最も近いクラスターを求めます。この計算式で求められるクラスターの割り当ては、「階層型クラスター分析」で求められるものとは必ずしも一致しません。クラスターの決定方法が異なるためです。ただし、かなり似通ったものとなります。([要約したデータ][データは距離行列]、または[積み重ねたデータ]を選択した場合はこのオプションは表示されません。)

クラスター履歴の保存

「クラスター分析の履歴」レポートの情報を、新しいデータテーブルに保存します。

表示順序の保存

樹形図内での行の順序を含むデータテーブル列を作成します。

距離行列の保存

行間の距離を含んだデータテーブルを新たに作成します。

星座樹形図の保存

星座樹形図の座標をデータテーブルに保存します。([要約したデータ]、[データは距離行列]、または[積み重ねたデータ]を選択した場合はこのオプションは表示されません。)

クラスター階層の保存

スクリプトで樹形図を描くために必要な情報がデータテーブルに保存されます。結合ごとに、結合先・結合者・結果を表す3つの行が作成され、クラスター中心・サイズなどの情報が保存されます。

樹形図データの保存

JMPとSASでクラスター分析の樹形図を比較する場合に必要な情報をデータテーブルに保存します。結合ごとに、新しいクラスターにつき1行ずつ、クラスターサイズなどの情報が保存されます。

クラスター分析の履歴

「クラスター分析の履歴」レポートの表示/非表示を切り替えます。クラスター分析の履歴を参照してください。

クラスターの要約

([データは距離行列]を選択した場合は表示されません。)以下の情報を含むレポートの表示/非表示を切り替えます。

クラスター平均

クラスターごとの行数と平均を含んだ表です(ただし、積み重ねデータの場合は、行数ではなくて、「対象のID」の個数です)。

クラスター標準偏差

クラスターごとの行数と標準偏差を含んだ表です(ただし、積み重ねデータの場合は、行数ではなくて、「対象のID」の個数です)。

クラスター平均プロット

平均のパラレルプロットまたは2次元ヒートマップを表示します。

[積み重ねデータ]で「属性のID」列を2つ指定したとき以外は、パラレルプロットが表示されます。パラレルプロットでは、各変数の軸のスケールが次のように設定されます。

[データの標準化]を選択した場合、軸は平均±2標準偏差の範囲となります。この場合、標準偏差と平均は生データに対して計算されます。クラスター平均がこの範囲を超えた場合、軸の範囲は延長されます。

[データの標準化]を選択しなかった場合は、共通したスケールの縦軸が使われます。(このスケールはグラフビルダーの[スケールの統一]オプションと同じです。)

[積み重ねデータ]で「属性のID」列を2つ指定したときは、Y変数の平均を座標ごとに描いた2次元プロットが表示されます。このプロットは、[青->グレー->赤]のグラデーションによって、色付けされます。

列の要約

各変数に対して、その変数の変動のうちクラスターで説明される割合を表示します。この値は、クラスターを説明変数として分散分析をしたときのR2乗値(決定係数)です。このオプションでは、棒グラフも表示されます。

最後の方に結合した外れ値

アルゴリズムの最後の方のステップで結合された行もしくは列の表を表示します。この表に含まれるデータは、アルゴリズムが80%完了した時点で、まだそのデータ1つだけでクラスターを形成していたものです。これらのデータはアルゴリズムの最後の方まで1つだけのクラスターであったことから、データセット内の外れ値である可能性があります。

星座樹形図

階層クラスター分析の星座樹形図の表示/非表示を切り替えます。このグラフでは、個々のデータ行を端点、各クラスター結合を新しい点として表し、それらを線で結んでクラスターへの所属を表します。線の長さはクラスター間の距離を表し、線が長いほど、クラスター間の距離が離れていることを示します。

星座樹形図の線にマウスを置けば、長さが表示されます。ただし、長さは相対値です。軸のスケール、点の方向、線の角度は恣意的です。ノードの末端が離れたり、プロットが雑然としたものにならないように決定されます。これは大規模なデータセットで重要になります。

星座樹形図内を右クリックし、[ラベル表示]を選択解除すると、端点のラベルが表示されなくなります。

散布図行列

(「データ形式」で[通常のデータ]を選択した場合のみ使用可能。)変数をすべて使用した散布図行列を作成します。

パラレルプロット

(「データ形式」で[通常のデータ]を選択した場合のみ使用可能。)クラスターごとにパラレルプロットを作成します。軸のスケールは、クラスター平均プロットの場合と同様です。クラスター平均プロットを参照してください。

クラスター調整の処置比較

(Shiftキーを押しながら「階層型クラスター分析」の赤い三角ボタンをクリックした場合にのみこのオプションは表示されます。)1つの応答列と2水準の処置列を選択します。「クラスターで調整した平均の差」レポートが表示されます。

以下のオプションの詳細については、『JMPの使用法』の「JMPレポートのローカルデータフィルタ」「JMPレポートの[やり直し]メニュー」、および「JMPレポートの[スクリプトの保存]メニュー」を参照してください。

ローカルデータフィルタ

データをフィルタリングするためのローカルデータフィルタの表示/非表示を切り替えます。

やり直し

分析を繰り返したり、やり直したりするオプションを含みます。また、[自動再計算]オプションに対応しているプラットフォームにおいては、[自動再計算]オプションを選択すると、データテーブルに加えた変更が、該当するレポートに即座に反映されるようになります。

プラットフォーム環境設定

現在のプラットフォームの環境設定を表示したり、現在のJMPレポートの設定に合わせて環境設定を変更したりできます。

スクリプトの保存

レポートを再現するためのスクリプトを保存するオプションが、保存先ごとに用意されています。

Byグループのスクリプトを保存

By変数の全水準に対するレポートを再現するスクリプトを保存するオプションが、保存先ごとに用意されています。起動ウィンドウでBy変数を指定した場合のみ使用可能です。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).