「CD3」から「MCB」までの変数を[Y, 列]に指定した「Cytometry.jmp」データテーブルの「設定パネル」を図14.5に示します。「設定パネル」を使ってクラスター数を1つ指定して1回ずつ実行していくことも、[クラスター最大数]オプションを使って、クラスター数の範囲を指定し、まとめて実行することもできます。
図14.5 正規混合法の設定パネル
「モデルに基づくクラスター分析」の設定パネルには、次のようなオプションがあります。
クラスターの数
形成されるクラスターの個数。
クラスター最大数(オプション)
形成されるクラスター数の上限値。ここである値を入力すると、[クラスターの数]に入力された値と[クラスター最大数(オプション)]に入力された値の間にあるすべての整数に対し、個別の分析が行われます。
実行
クラスターをあてはめます。
対角分散
共分散行列の非対角要素をすべて0に固定し、変数間に相関のない多変量正規分布をあてはめます。
メモ: このオプションは、オブザベーション数が列数より少ない場合に、共分散行列が特異になるのを防ぎたいときに使用してください。また、変数の個数が多い場合に、大規模な共分散行列の計算を回避するためにも使用してください。
外れ値のクラスター
通常の多変量正規分布のクラスターには分類されない外れ値を検出する目的で、クラスターを1つ追加します。この外れ値のクラスターには「0」という番号がつけられ、オブザベーションの度数が「クラスター要約」レポートに表示されます。外れ値のクラスターに分類されるオブザベーションの分布は、オブザベーションを囲む超立方体に対して一様であると仮定されます。
詳細設定
以下のような細かい設定を行えます。
ツアー
推定の反復計算全体を行う回数(ツアーの回数)。1つの推定の計算ごとに、異なる初期値が使われます。異なる初期値で独立した反復計算を何回も行うことにより、局所解への収束が軽減されます。
最大反復数
EMアルゴリズムにおける1つの反復計算における最大反復回数です。
収束基準
指定した基準値以下になると、EMアルゴリズムにおける反復計算が停止されます。この基準値には、対数尤度の差が使われています。