公開日: 04/01/2021

潜在クラス分析

潜在クラス分析を実行すると、内容の似たような文書が同じクラスターに属するように分類されます。「潜在クラス分析」レポートには、モデルの指定内容、ベイズ情報量規準値（BIC）、［テキストの表示］ボタンが表示されます。「クラスターの混合確率」表から1つまたは複数のクラスターを選択し、［テキストの表示］ボタンをクリックすると、そのクラスターに分類される確率の高い文書のテキストが表示されます。

「潜在クラス分析」レポートの赤い三角ボタンをクリックすると、以下のオプションが表示されます。

表示オプション

「潜在クラス分析」レポートに表示する内容を指定します。デフォルトでは、「クラスターごとのワードクラウド」以外のレポートがすべて表示されます。

クラスターの混合確率

該当のクラスターに文書が含まれる事前確率を示した表の表示／非表示を切り替えます。

ヒント: 「クラスターの混合確率」表で1つまたは複数の行を選択すると、そのクラスターに事後確率により割り当てられるデータ行も選択されます。

クラスターごとの単語確率

ある文書が特定のクラスターに属しているという条件のもとで、その文書に各単語が登場する条件付き確率の推定値を示します。単語は、デフォルトで、コーパス全体での出現頻度の降順で並べられます。

「最も特徴的なクラスター」には、その単語が最も高い割合で出現するクラスターが示されます。

「最も確率の高いクラスター」には、その単語を含む文書をランダムに選んだときに、その文書が入る確率が最も高いクラスターが示されます。

クラスターごとの上位単語

各クラスターで最もスコアの高い上位10個の単語の表示／非表示を切り替えます。クラスターcの単語tのスコアSt,cは、次のように計算されます。

Equation shown here

ここで、mean(pt)は、単語tのクラスターごとの単語確率の平均値、pt,cは単語tのクラスターcにおける単語確率です。

多次元尺度構成プロット

多次元尺度構成プロット（MDSプロット）の表示／非表示を切り替える。このプロットは、クラスターの類似度を2次元で表します。多次元尺度構成プロットの詳細については、『多変量分析』の多次元尺度構成を参照してください。文書を選択して［テキストの表示］ボタンをクリックすると、ウィンドウが開き、その文書のテキストが表示されます。

行ごとのクラスター確率

「混合確率」表の表示／非表示を切り替えます。この表には、各クラスターに属する事後確率が行ごとに示されます。「最尤クラスター」には、この事後確率が最も高いクラスターが示されます。

クラスターごとのワードクラウド

クラスターごとのワードクラウドの表示／非表示を切り替えます。

クラスター名の変更

1つまたは複数のクラスターに内容のわかりやすい名前を付けることができる。

確率の保存

「混合確率」表の値を、データテーブルの対応する行に保存します。

確率の計算式の保存

データテーブルに、各クラスターのスコア計算式の列と、最尤クラスターの計算式の列を追加します。

スコアを求める計算式は、JSL関数のText Score()が使用されます。なお、この際、計算方法を示す引数として、“LCA”が指定されます。

クラスターによる色分け

データテーブルの行に、最尤クラスターごとに色を付けます。

削除

「テキストエクスプローラ」レポートから、「潜在クラス分析」レポートを削除します。

潜在クラス分析の詳細については、『多変量分析』の潜在クラス分析を参照してください。

注: 「テキストエクスプローラ」プラットフォームの潜在クラス分析で使われているアルゴリズムは、文書単語行列の特定の構造に基づいているため、「潜在クラス分析」プラットフォームの結果と正確には一致しません。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).