“文本分析器”平台中的“SVD”红色小三角菜单包含以下选项:
SVD 散点图矩阵
显示或隐藏词条和文档奇异值分解向量的散点图矩阵。选择该选项时,系统提示您选择散点图矩阵的大小。使用该散点图矩阵不仅可视化奇异值分解的前两个维,还可以可视化更多维。点击“显示文本”按钮将打开一个窗口,其中包含选定文档的文本。
图 12.11 文档和词条空间的 SVD 散点图
主题分析, 旋转 SVD
执行文档词条矩阵的可变最大旋转偏奇异值分解以生成称为主题的词条组。您可以多次选择该选项以查找不同的主题数。请参见主题分析。
对词条进行聚类
显示或隐藏数据中词条的层次聚类分析。在系统树图右侧,提供了用于设置聚类数和将聚类保存至数据表的选项。对于每个词条,该数据表包含频数、包含词条的文档数以及给它分配的聚类。有关层次聚类和系统树图的详细信息,请参见《多元方法》中的层次聚类。
对文档进行聚类
显示或隐藏数据中文档的层次聚类分析。系统树图的右侧,可使用选项来执行以下操作:设置聚类数、将聚类保存到数据表中的列以及在选定的系统树图分支中显示文档。
选择近邻
查找并选择文档 SVD 图中所选点的最近邻。该算法使用奇异值分解中的 U 矩阵查找最近邻。选择该选项时,您必须指定要选择的最近邻数。默认情况下,该选项选择 10 个最近邻。
保存文档奇异向量
将文档奇异值分解中的用户指定的奇异向量数作为列保存到数据表。前两个保存的列表示在文档 SVD 图中绘制的点。请参见潜在语义分析 (SVD)。
保存奇异向量公式
将建模类型为“向量”的公式列(其中包含文档奇异值分解)保存到数据表中。生成的列使用 Text Score() JSL 函数。有关该函数的详细信息,请参见“帮助”>“脚本索引”。
保存词条奇异向量
将来自词条奇异值分解的用户指定的奇异向量数作为列保存到一个新数据表,该表的每行对应一个词条。若“词条表”数据表已打开,该选项将这些列保存到该数据表。前两个保存的列表示在词条 SVD 图中绘制的点。请参见潜在语义分析 (SVD)。
删除
从“文本分析器”报表窗口中删除 SVD 报表。