潜在クラス分析を実行すると、内容の似たような文書が同じクラスターに属するように分類されます。「潜在クラス分析」レポートには、モデルの指定内容、ベイズ情報量規準値(BIC)、[テキストの表示]ボタンが表示されます。「クラスターの混合確率」表から1つまたは複数のクラスターを選択し、[テキストの表示]ボタンをクリックすると、そのクラスターに分類される確率の高い文書のテキストが表示されます。
「潜在クラス分析」レポートの赤い三角ボタンをクリックすると、以下のオプションが表示されます。
表示オプション
「潜在クラス分析」レポートに表示する内容を指定します。デフォルトでは、「クラスターごとのワードクラウド」以外のレポートがすべて表示されます。
クラスターの混合確率
該当のクラスターに文書が含まれる事前確率を示した表の表示/非表示を切り替えます。
ヒント: 「クラスターの混合確率」表で1つまたは複数の行を選択すると、そのクラスターに事後確率により割り当てられるデータ行も選択されます。
クラスターごとの単語確率
ある文書が特定のクラスターに属しているという条件のもとで、その文書に各単語が登場する条件付き確率の推定値を示します。単語は、デフォルトで、コーパス全体での出現頻度の降順で並べられます。
「最も特徴的なクラスター」には、その単語が最も高い割合で出現するクラスターが示されます。
「最も確率の高いクラスター」には、その単語を含む文書をランダムに選んだときに、その文書が入る確率が最も高いクラスターが示されます。
クラスターごとの上位単語
各クラスターで最もスコアの高い上位10個の単語の表示/非表示を切り替えます。クラスターcの単語tのスコアSt,cは、次のように計算されます。
ここで、mean(pt)は、単語tのクラスターごとの単語確率の平均値、pt,cは単語tのクラスターcにおける単語確率です。
多次元尺度構成プロット
多次元尺度構成プロット(MDSプロット)の表示/非表示を切り替える。このプロットは、クラスターの類似度を2次元で表します。多次元尺度構成プロットの詳細については、『多変量分析』の多次元尺度構成を参照してください。文書を選択して[テキストの表示]ボタンをクリックすると、ウィンドウが開き、その文書のテキストが表示されます。
行ごとのクラスター確率
「混合確率」表の表示/非表示を切り替えます。この表には、各クラスターに属する事後確率が行ごとに示されます。「最尤クラスター」には、この事後確率が最も高いクラスターが示されます。
クラスターごとのワードクラウド
クラスターごとのワードクラウドの表示/非表示を切り替えます。
クラスター名の変更
1つまたは複数のクラスターに内容のわかりやすい名前を付けることができる。
確率の保存
「混合確率」表の値を、データテーブルの対応する行に保存します。
確率の計算式の保存
データテーブルに、各クラスターのスコア計算式の列と、最尤クラスターの計算式の列を追加します。
スコアを求める計算式は、JSL関数のText Score()が使用されます。なお、この際、計算方法を示す引数として、“LCA”が指定されます。
クラスターによる色分け
データテーブルの行に、最尤クラスターごとに色を付けます。
削除
「テキストエクスプローラ」レポートから、「潜在クラス分析」レポートを削除します。
潜在クラス分析の詳細については、『多変量分析』の潜在クラス分析を参照してください。
注: 「テキストエクスプローラ」プラットフォームの潜在クラス分析で使われているアルゴリズムは、文書単語行列の特定の構造に基づいているため、「潜在クラス分析」プラットフォームの結果と正確には一致しません。