「テキストエクスプローラ」プラットフォームで潜在クラス分析を実行すると、内容の似たような文書が同じクラスターに属するように分類されます。「潜在クラス分析」レポートには、モデルの指定内容、ベイズ情報量規準値(BIC)、[テキストの表示]ボタンが表示されます。「クラスターの混合確率」表から1つまたは複数のクラスターを選択し、[テキストの表示]ボタンをクリックすると、そのクラスターに分類される確率の高い文書のテキストが表示されます。
「潜在クラス分析」レポートの赤い三角ボタンをクリックすると、以下のオプションが表示されます。
表示オプション
「潜在クラス分析」レポートに表示する内容を指定します。デフォルトでは、「クラスターごとのワードクラウド」以外のレポートがすべて表示されます。
クラスター混合確率
該当のクラスターに文書が含まれる事前確率を示した表の表示/非表示を切り替えます。
ヒント: 「クラスターの混合確率」表で1つまたは複数の行を選択すると、そのクラスターに事後確率により割り当てられるデータ行も選択されます。
クラスターごとの単語確率
ある文書が特定のクラスターに属しているという条件のもとで、その文書に各単語が登場する条件付き確率の推定値を示します。単語は、デフォルトで、コーパス全体での出現頻度の降順で並べられます。
「最も特徴的なクラスター」には、その単語が最も高い割合で出現するクラスターが示されます。
「最も確率の高いクラスター」には、その単語を含む文書をランダムに選んだときに、その文書が入る確率が最も高いクラスターが示されます。
クラスター別上位単語
各クラスターで最もスコアの高い上位10個の単語の表示/非表示を切り替えます。クラスターcの単語tのスコアSt,cは、次のように計算されます。
ここで、mean(pt)は、単語tのクラスターごとの単語確率の平均値、pt,cは単語tのクラスターcにおける単語確率です。
多次元尺度構成プロット
多次元尺度構成プロット(MDSプロット)の表示/非表示を切り替えます。このプロットは、クラスターの類似度を2次元で表します。多次元尺度構成プロットの詳細については、『多変量分析』の多次元尺度構成を参照してください。文書を選択して[テキストの表示]ボタンをクリックすると、ウィンドウが開き、その文書のテキストが表示されます。
行ごとのクラスター確率
「混合確率」表の表示/非表示を切り替えます。この表には、各クラスターに属する事後確率が行ごとに示されます。「最尤クラスター」には、この事後確率が最も高いクラスターが示されます。
クラスター別ワードクラウド
クラスターごとのワードクラウドの表示/非表示を切り替えます。
クラスター名の変更
クラスターにわかりやすい名前を付けることができます。
確率の保存
「混合確率」表の値を、データテーブルの対応する行に保存します。
確率の計算式を保存
各クラスターに属する事後確率と、その事後確率が最大となるクラスターに分類する計算式の列を、データテーブルに保存します。
スコアを求める計算式は、JSL関数のText Score()が使用されます。なお、この際、計算方法を示す引数として、“LCA”が指定されます。
クラスターによる色分け
データテーブルの行に、最尤クラスターごとに色を付けます。
削除
「テキストエクスプローラ」レポートから、「潜在クラス分析」レポートを削除します。
潜在クラス分析の詳細については、『多変量分析』の潜在クラス分析を参照してください。
メモ: 「テキストエクスプローラ」プラットフォームでも潜在クラス分析が実行できますが、そこで使われているアルゴリズムは文書単語行列の希薄性を利用しています。そのため、「テキストエクスプローラ」プラットフォームでの潜在クラス分析の結果は、「潜在クラス分析」プラットフォームでの結果と正確には一致しません。