“文本分析器”平台中的“潜在语义分析”选项从奇异值分解生成两个 SVD 图和一个奇异值表。
第一个图为每个文档包含一个点。对于给定文档,标绘的点的定义方式如下:前两个奇异向量(U 矩阵的前两列)中的文档值乘以对角线奇异值矩阵 (S)。该图等同于“主成分”平台中的得分图。该图中的每个点都表示一个文档(数据表行)。您可以通过选择该图中的点来选择数据表中的相应行。
第二个图为每个词条包含一个点。对于给定词条,标绘的点的定义方式如下:前两个奇异向量(V‘ 矩阵的前两行)中的词条值乘以对角线奇异值矩阵 (S)。该图等同于“主成分”平台中的“载荷图”。在该图中,这些点对应“词条列表”表中的行。
在每个 SVD 图的上方,您可以点击“显示文本”按钮打开一个窗口,其中包含图中选定点的文本。
在文档和词条 SVD 图下面,显示一个奇异值的表。这些在文档词条矩阵的奇异值分解中是 S 矩阵的对角线元素。“奇异值”表还包含等价的主成分分析的相应特征值列。类似于“主成分”平台,每个特征值(或奇异值)解释的变异的百分比和累积百分比都对应一列。您可以使用“累积百分比”列决定您要保留的来自 DTM 的方差百分比,然后使用相应的奇异向量数。