JMP 13.2 联机文档
发现 JMP
使用 JMP
基本分析
基本绘图
刻画器指南
实验设计指南
拟合线性模型
预测和专业建模
多元方法
质量和过程方法
可靠性和生存方法
消费者研究
Scripting Guide
JSL Syntax Reference
基本分析
•
文本分析器
•
文本分析器报表
• 词条和短语列表
上一个
•
下一个
词条和短语列表
“词条和短语列表”报表包含标记化后在文本中找到的词条和短语的表。有关“词条和短语列表”报表的示例,请参见
文本分析器报表的示例
。词条列表中的“计数”列指示词条在语料库中出现的次数。短语列表中的“计数”列指示短语在语料库中出现的次数,“数目”列指示短语中的单词数。
默认情况下,词条列表按计数的降序排序;计数相同的词条按字母顺序排序。短语列表按计数的降序排序,计数相同的短语按长度 (N) 的降序排序。短语列表中再次出现相同计数时按字母顺序排序。可以使用每个列表中的选项将每个列表的排序顺序更改为字母排序。
短语列表中显示的短语由启动窗口中的
每个短语的最大单词数
和
最大短语数
选项的设置决定。在数据表中仅出现一次的短语不显示在短语列表中。
短语可以指定为各种作用域的词条。根据短语规格的作用域对已指定为词条的短语列表中的短语着色。请参见
指定短语的颜色
。有关指定不同作用域的短语的详细信息,请参见
词条选项管理窗口
。
指定短语的颜色
作用域
颜色
内置
红色
用户逻辑库
绿色
列属性
橙色
本地
灰色
针对词条和短语的操作
您可以通过以下方式访问“词条列表”和“短语列表”表中的选项:选择项,然后在每个表最左侧的列中右击。可以通过以下方式将每个表保存为一个数据表:在每个表的“计数”列中右击,然后选择“制成数据表”。
词条列表弹出菜单选项
当您在“词条列表”表的“词条”列中右击时,将显示一个包含以下选项的弹出菜单:
选择行
在包含选定词条的数据表中选择行。
显示文本
显示包含选定词条的文档。
注意:
默认情况下,只显示前 10,000 个文档。若包含选定词条的文档数超过 10,000,将显示一个窗口,您可以在其中增大此限值。
按字母顺序
在字母顺序和“计数”降序顺序之间切换词条列表的排序顺序。
查找
允许在词条列表中搜索某个字符串。当“查找”操作的结果可见时,您可以通过再次选择“查找”来返回到词条的完整列表。
复制
将选定词条放置到剪贴板。
颜色
使您可以将颜色分配给选定词条。
标签
将标签放置在选定词条的词条 SVD 图中相应的点上。
包含短语
在“短语列表”表中选择包含选定词条的短语。
保存指示符
为在词条列表中选择的每个词条将指示符列保存到数据表。若行中的文档包含词条,则该行的指示符列的值为 1;否则为 0。
保存公式
为在词条列表中选择的每个词条将列公式保存到数据表。若行中的文档包含词条,则该行的列公式计算结果为 1;否则为 0。这对于新文档很有用。
重新编码
使您可以更改一个或多个词条的值。在选择该选项前请在列表中选择词条。在选择该选项后,将显示“重新编码”窗口。请参见《
使用 JMP
》手册中的
输入和编辑数据
“输入和编辑数据”一章。
添加停止词
将选定词条添加到停止词列表并从词条列表中删除这些词条。该操作还将更新短语列表。
添加词干例外情况
将选定词条添加到从词干处理中排除的词条列表。
制成数据表
从报表创建 JMP 数据表。
制作合并数据表
在报表中搜索类似您所选表的其他表,然后将其合并到单个 JMP 数据表中。
短语列表弹出菜单选项
当您在“短语列表”表的“短语”列中右击时,将显示一个包含以下选项的弹出菜单:
选择行
在包含选定短语的数据表中选择行。
显示文本
显示包含选定短语的文档。
保存指示符
为在短语列表中选择的每个短语将指示符列保存到数据表。若行中的文档包含短语,则该行的指示符列的值为 1;否则为 0。
按字母顺序
在字母顺序和“计数”降序顺序之间切换短语列表的排序顺序。
查找
允许在短语列表中搜索某个字符串。当“查找”操作的结果可见时,您可以通过再次选择“查找”来返回到短语的完整列表。
复制
将选定的短语放置在剪贴板上。
选择包含项
在短语列表中选择包含选定短语的较大短语。
选择所含项
在短语列表中选择被选定短语包含的较小短语。
添加短语
将选定短语添加到词条列表并相应更新词条计数。
添加停止词
将选定短语添加到停止词列表并从短语列表中删除这些短语。该操作还将更新词条列表。
制成数据表
从报表创建 JMP 数据表。
制作合并数据表
在报表中搜索类似您所选表的其他表,然后将其合并到单个 JMP 数据表中。