「潜在クラス分析」プラットフォームは、カテゴリカルなデータに対して潜在クラスモデルをあてはめ、各データ行(各オブザベーション)が所属する事後確率の最も高いクラスターを特定します。潜在クラス分析では、分析者から観測されない潜在変数が、グループ変数となっています。このクラスターは、「潜在クラス」と呼ばれています。潜在クラス分析の応用例としては、たとえば、リスク行動についての質問紙調査データをクラスタリングする、などが考えられます。
潜在クラスモデルでは、「観測されるデータは、多項分布の混合分布に従っている」と仮定します。このモデルには、2種類のパラメータの組(gとr)があります。gパラメータは、各クラスターに属する事前確率を表します。一方、rパラメータは、該当のクラスターに属すると条件付けられた上で、各観測変数が生じる確率を表します。各潜在クラスがどのような特徴をもつかは、条件付き確率(ρパラメータ)によって解釈されます。
分析結果を意義のあるものとするには、求められたクラスターを適切に解釈する必要があります。潜在クラスの特徴を見て、それらの特徴から各クラスを解釈します。
メモ: 応答列のいずれかに1つでも欠測値がある行は、その行すべてのデータが分析から除外されます。
潜在クラスモデルの詳細については、Collins and Lanza(2010)およびGoodman(1974)を参照してください。
JMPには、データ行(オブザベーション)をクラスタリングするためのプラットフォームが4つ用意されています。「潜在クラス分析」は、そのなかの1つです。4つの手法の比較については、クラスター分析用プラットフォームの概要を参照してください。