在“文本分析器”平台中,情感分析使用词法分析识别文档中的情感词条,并对文档的正面、负面和整体情感进行评分。该分析假设每个文档都是在单个主题上具有二元情感的自由文本。情感分析将基本自然语言处理 (NLP) 并入结果。有关自然语言处理的详细信息,请参见 https://opennlp.apache.org/。若不想使用 NLP,请取消选择“解析文档”选项。
提示:有关“情感分析”的示例,请选择帮助 > 样本数据文件夹,打开 Chips.jmp 并运行“文本分析器 - 情感分析”表脚本。
注意:
• 在情感分析中,一个词只能在一类词条中起作用:否定词条、强化词条或情感词条。
• 情感分析可以识别一些表情符号,或被视为单个单元的字符序列。您可以在“情感词条”报表或“管理情感词条”窗口中查看内置的表情符号及其默认情感得分。
• 若将某个词指定为否定词条、强化词条或情感词条,而该词已被指定为停止词,则只要“情感分析”报表处于打开状态,该词将被作为停止词暂时删除。这一暂时删除会影响整个“文本分析器”报表。当“情感分析”报表关闭时,它将恢复为停止词。
默认情况下,“文本分析器”平台中的“情感分析”报表包含一个打开的报表:“情感汇总”。其他报表最初是关闭的。
图 12.13 “情感分析”报表
“情感分析”报表包含以下报表:
包含当前情感分析中否定词条的列表。右击该列表可查看其他选项的菜单。您可以选择列表中的词条将其删除。
包含强化词条及其相应的乘数值的列表。右击该列表可查看其他选项的菜单。您可以选择列表中的词条将其删除。
包含情感词条及其相应的得分值的列表。该报表支持您添加新的情感词条。“可能的情感”表包含可以考虑添加为情感词条的词条的计数。要将某个词条添加为情感词条,请在“可能的情感”表中选择该词条,然后点击“+情感”下面的按钮之一。要选择未列出的情感得分值,可以在将其添加到情感词条列表后编辑该得分值。
在“可能的情感”表中选择某个词条时,包含该词条的文档将显示在“情感词条”报表的右侧。这为该词条在语料库中的用法提供了上下文。
包含用于对语料库中的特征进行评分的选项。特征是情感词条所描述的内容。点击搜索按钮可生成可能的特征词条的列表。从“可能的特征”表中选择一个或多个词条时,包含这些词条的文档摘录将显示在表右侧的文本框中。点击对选定特征评分按钮可更新“情感汇总”报表,以显示对选定特征词条评分的结果。
注意:若选择“解析文档”选项,则当单词出现在与情感相同的伞形子句中时,“特征”报表会对这些词评分。
包含基于当前设置的情感分析结果。该报表包含一个“汇总”表及直方图、一个“文档得分”表、一个“情感词条”表、一个文本框,以及一个支持您添加更多情感和强化词条的控制面板。
汇总表显示了按文档的评分方式细分的文档的计数和得分均值。得分均值由“得分”选项的设置确定。请参见“情感分析”报表选项。汇总直方图显示文档的总情感得分的分布。该直方图是交互式的,因此您可以点击一个直条来突出显示“文档得分”表中的相应文档。
“文档得分”表显示了正负情感得分总和和均值,以及每个文档的总情感得分。若选择表中的一行,则相应文档的文本将显示在表下方的文本框中。若指定“得分列”,则表中包含评分列中的值。
提示:您可以悬停在“文档得分”表中的单元格上方,以查看用于生成表结果的得分计算。
“情感词条”表列出每个情感词条、其得分值以及该词条在语料库中出现的次数。
提示:对于含有多个单词的情感词条,可以悬停在“得分”列中的单元格上方,以查看用于生成得分的计算。
文本框显示在“文档得分”表中选择的文档的文本或在“情感词条”表中选择的词条的上下文。在“文档得分”表中选择某个文档时,文本框右侧将显示该文档中的情感列表。
提示:当您悬停在文本框中被分类为否定词条、强化词条或情感词条的词条上方时,将出现一个框,其中显示该分类并包含一个“删除”按钮。点击删除按钮可从否定词条、强化词条或情感词条列表中快速删除该词条。
在文本框中选择某个词条后,控制面板将激活。要将某个词条添加为情感词条,请在文本框中选择该词条,然后点击“+情感”下面的按钮之一。要将某个词条添加为强化词条,请在文本框中选择该词条,然后点击“×强化”下面的按钮之一。
在“文本分析器”平台中,“情感分析”红色小三角菜单包含以下选项:
评分
包含以下用于为文档计算总得分的选项:
统一尺度
将正负短语的得分加总。然后将总和除以文档中的短语数以确定总得分。
最小最大值
总得分计算为最大正分和最小负分之和。
得分列
指定一个数据表列,该列包含可与计算的情感进行比较的已知信息。得分列将添加至“文档得分”表。
提示:您可以通过直观地比较“总得分”列与得分列来评估情感得分。
解析文档
指定是否使用自然语言处理 (NLP) 来解析文档。有关自然语言处理的详细信息,请参见 https://opennlp.apache.org/。
保存文档得分
将“文档得分”表中的列保存到数据表中的新列。新列包含正负情感得分总和和均值,以及每个文档的总情感得分。
按文档保存情感得分计数
在数据表中为每个情感词条保存一列。每列包含每个文档中每个情感词条的出现次数。
显示否定词条
显示或隐藏“否定词条”报表。
显示强化词条
显示或隐藏“强化词条”报表。
显示情感词条
显示或隐藏“情感词条”报表。
显示特征查找工具
显示或隐藏“特征”报表。
显示情感云
在“情感汇总”报表中显示或隐藏情感词条的词云。
包含内置否定词条
指定情感分析中使用的否定词条是否包含内置否定词条。
包含内置强化词条
指定情感分析中使用的强化词条是否包含内置强化词条。
包含内置情感词条
指定情感分析中使用的情感词条是否包含内置情感词条。
管理否定词条
显示一个窗口,您可以在其中添加或删除否定词条。可以在“用户”、“列”和“本地”水平上应用所做更改。您还可以指定本地例外情况,用于排除在任何其他水平上指定的否定词条。请参见词条选项管理窗口。
管理强化词条
显示一个窗口,您可以在其中添加或删除强化词条。可以在“用户”、“列”和“本地”水平上应用所做更改。您还可以指定本地例外情况,用于排除在任何其他水平上指定的强化词条。请参见词条选项管理窗口。
管理情感词条
显示一个窗口,您可以在其中添加或删除情感词条。可以在“用户”、“列”和“本地”水平上应用所做更改。您还可以指定本地例外情况,用于排除在任何其他水平上指定的情感词条。请参见词条选项管理窗口。