この例では、Iris.jmpサンプルデータテーブルを使用しています。このテーブルには、3種類のアヤメのがくの長さ、がくの幅、花弁の長さ、花弁の幅の測定値が記載されています。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Iris.jmp」を開きます。
2. [分析]>[クラスター分析]>[K Meansクラスター分析]を選択します。
3. 「がくの長さ」、「がくの幅」、「花弁の長さ」、および「花弁の幅」を選択して、[Y, 列]をクリックします。
4. [OK]をクリックします。
5. 設定パネルの「方法」リストから[自己組織化マップ]を選択します。
6. [行数]を1、[列数]を2に設定します。
7. [実行]をクリックします。
8. 「設定パネル」レポートを開きます。
9. [行数]を1、[列数]を3に設定します。
10. [実行]をクリックします。
11. 「設定パネル」レポートを開きます。
12. [行数]を2、[列数]を2に設定します。
13. [実行]をクリックします。
図13.10 SOMクラスターの比較
「クラスターの比較」レポートは、レポートウィンドウの最上部に表示されます。CCC(Cubic Clustering Criterion:立方体クラスター規準)の最も大きいときのクラスタリングが、最も適したクラスターであるとと考えられます。CCCが最大になるクラスター数は3です。実際、このデータは3品種のアヤメを記録したものです。
14. 「自己組織化マップ 1 x 3グリッド」レポートまでスクロールします。分類が完璧ではなかったことがわかります。実際のデータには、3品種のあやめはそれぞれ50ずつあります。
図13.11 Iris.jmpの「自己組織化マップ」レポート
15. データテーブルで、[種類]列を選択し、[行]>[列の値による色/マーカー分け]を選択します。
16. マーカーの[クラシック]オプションを選択します。
17. [OK]をクリックします。
18. 「自己組織化マップ 1 x 3グリッド」の横の赤い三角ボタンをクリックし、[バイプロット]を選択します。
図13.12 自己組織化マップのバイプロット
クラスター3のすべての行がsetosaとして正しく識別されていることが分かります。他の2品種はvirginicaとverisicolorでわずかに重複しており、互いに間違われやすくなっています。