JMP 13.2 联机文档
发现 JMP
使用 JMP
基本分析
基本绘图
刻画器指南
实验设计指南
拟合线性模型
预测和专业建模
多元方法
质量和过程方法
可靠性和生存方法
消费者研究
Scripting Guide
JSL Syntax Reference
基本分析
•
文本分析器
•
“文本分析器”平台选项
• 文本分析选项
上一个
•
下一个
文本分析选项
“文本分析器”红色小三角菜单包含以下分析选项:
潜在类分析
使用稀疏矩阵例程对二进制加权文档词条矩阵执行潜在类分析。
当您从“文本分析器”红色小三角菜单选择“潜在类分析”时,将显示包含以下选项的“规格”窗口:
最大词条数
包括在潜在类分析中的最大词条数。
最小词条频数
一个词条要包括在潜在类分析中必须出现的最小次数。
聚类数
潜在类分析中的聚类数。
请参见
潜在类分析
。
潜在语义分析, SVD
执行文档词条矩阵的稀疏奇异值分解。请参见
潜在语义分析 (SVD)
。
主题分析, 旋转 SVD
执行文档词条矩阵的可变最大旋转奇异值分解以生成称为主题的词条组。请参见
主题分析
。
对词条进行聚类
显示或隐藏数据中词条的层次聚类分析。系统树图的右侧,有一些选项用于设置聚类数和将聚类保存到数据表。对于每个词条,该数据表包含频数、包含词条的文档数以及给它分配的聚类。
对文档进行聚类
显示或隐藏数据中文档的层次聚类分析。系统树图的右侧,有一些选项用于设置聚类数、将聚类保存到数据表中的列以及在选定的系统树图分支中显示文档。
SVD 散点图矩阵
(在选择“潜在语义分析,SVD”后可用。)显示或隐藏词条和文档奇异值分解向量的散点图矩阵。选择该选项时,系统提示您选择散点图矩阵的大小。使用该散点图矩阵不只可视化奇异值分解的前两个维,还可以可视化更多维。点击“显示文本”按钮将打开一个窗口,其中包含选定文档的文本。
文档和词条空间的 SVD 散点图
主题散点图矩阵
(在选择“主题分析,旋转 SVD”后可用。)显示或隐藏旋转奇异值分解向量的散点图矩阵。点击“显示文本”按钮将打开一个窗口,其中包含选定文档的文本。
“奇异值分解规格”窗口
“文本分析器”平台中的分析选项基于文档词条矩阵 (DTM)。通过为词条列表中的每个词条(最大为指定的最大词条数)创建列来生成 DTM。每个文本文档(等价于数据表中的行)对应 DTM 的一行。DTM 单元格中的值取决于用户在“规格”窗口中指定的权重类型。
“SVD 规格”窗口
显示“奇异值分解规格”窗口。当您从“文本分析器”红色小三角菜单选择对文档词条矩阵执行奇异值分解的选项时,将显示包含以下选项的“规格”窗口:
最大词条数
包括在奇异值分解中的最大词条数。
最小词条频数
一个词条必须要包括在奇异值分解中的最小次数。
权重
用于确定进入文档词条矩阵单元格的值的权重方案。在
“文档词条矩阵规格”窗口
中介绍了各个权重方案选项。
奇异向量数
奇异值分解中的奇异向量数。默认值为文档数、词条数或 100 中的最小值。
中心化和统一尺度
文档词条矩阵的中心化和统一尺度选项。您可以选择
中心化
、
中心化和统一尺度
或
未中心化
。默认情况下,文档词条矩阵已中心化且统一尺度。
“SVD 规格”窗口