[トピック分析, 特異値分解を回転]オプションを選択すると、文書単語行列を特異値分解して得られた主成分負荷量がVarimax回転されます。この際、回転する主成分負荷量の次元として、文書単語行列から維持したいトピック数を指定します。トピック数を指定すると、「トピック分析」レポートが表示されます。
トピックの分析は、主成分分析の結果を回転させることと同じです。Varimax回転は、主成分負荷量(特異ベクトルに特異値をかけたもの)のいくつかの座標がくっきりと大きくなるように(少数の単語における数値が大きくなるように)、回転します。回転後のベクトルは、少数の単語だけが大きな値となるため、テキストの内容を解釈しやすくなります。負の値は、該当のトピックだけにはその単語が含まれていない傾向を表します。各トピックにおいて、負の値となっている単語は、正の値の単語よりも少なくなるようにしています。
「トピック分析」レポートには、回転後の負荷量が大きい単語がトピックごとに表示されます。また、回転した特異値分解に関連する他のレポートも表示されます。
「トピックごとの上位負荷量」レポートには、単語の表がトピックごとに表示されます。この表には、回転した後の負荷量の絶対値が大きい単語が表示され、負荷量の絶対値の降順で並べられます。これらの表は、各トピックの概念を判断するために役立ちます。
「トピック分析」レポートには、以下のレポートも表示されます。
トピック負荷量
単語の負荷量をトピックごとに示す行列が表示されます。この行列は、主成分負荷量を回転させた後の負荷量行列です。
トピック別のワードクラウド
ワードクラウドがトピックごとに表示されます。
トピックスコア
トピックと文書スコアの行列が表示されます。トピックに対する文書のスコアが高い場合は、そのトピックとの関連が強いことを示します。
トピック分析のスコアプロット
トピックのスコアのプロットが文書ごとに表示されます。また、「テキストの表示」ボタンもあります。文書を選択して[テキストの表示]ボタンをクリックすると、ウィンドウが開き、その文書のテキストが表示されます。
「トピック分析のスコアプロット」は、「トピックスコア」レポートの数値をグラフに描いたものです。各パネルは、トピック(「トピックスコア」レポートの行列の1列)に対応しています。パネル中の各点は、コーパス中の文書(「トピックスコア」レポートの行列の1行)に対応しています。
各トピックによって説明される分散
各トピックによって説明される分散の表が表示されます。この表には、各トピックによって説明される変動の割合(寄与率)とその累積(累積寄与率)も表示されます。
回転行列
Varimax回転の回転行列が表示されます。
「トピック分析」レポートの赤い三角ボタンをクリックすると、以下のオプションが表示されます。
トピックの散布図行列
回転した後の負荷量ベクトルの散布図行列の表示/非表示を切り替えます。文書を選択して[テキストの表示]ボタンをクリックすると、ウィンドウが開き、その文書のテキストが表示されます。
表示オプション
「トピック分析」レポートの各要素の表示/非表示を切り替えるオプション。「トピック分析」レポートを参照してください。
トピック名の変更
1つまたは複数のトピックに内容のわかりやすい名前を付けることができる。
文書 トピックベクトルの保存
ユーザが指定した数の、主成分スコアを回転したものを、データテーブルの列に保存します。
トピックベクトルの計算式の保存
主成分スコアを回転したものをベクトル尺度で求める計算式を、データテーブルの列に保存します。列の計算式には、JSL関数のText Score()が使用されます。この関数の詳細については、[ヘルプ]>[スクリプトの索引]を参照してください。
単語 トピックベクトルの保存
[単語テーブルの保存]オプションで作成したデータテーブルに、トピックベクトルの列を保存します。
削除
「特異値分解」レポートから「トピック分析」レポートを削除します。