重なりのある多変量正規分布からデータが得られたものである場合は、「正規混合」プラットフォームを用いるとよいでしょう。「正規混合」プラットフォームでは、処理を開始する前に、クラスターの個数を指定する必要があります。
「正規混合」プラットフォームは、「データが多変量正規分布の混合分布に従っている」と仮定した方法です。計算には、反復アルゴリズムが使われています。複数の混合されている各多変量正規分布が、それぞれ、1つのクラスターを表します。
クラスターがはっきりと分かれている場合は、階層型クラスター分析やk-means法が妥当です。しかし、クラスターが重なり合っている場合は正規混合法の方が妥当です。なぜなら、正規混合法は、境界によってグループを排他的に分類するのではなく、各クラスターに所属する確率を求めるからです。
図14.1 正規混合バイプロット