(仅当“语言”选项设置为“英语”、“德语”、“西班牙语”、“法语”或“意大利语”并且选定的“标记化”方法为“基本单词”时才可用。)显示或隐藏“基本单词”标记化方法使用的分隔符。要修改使用的一组分隔符,必须在 JSL 中使用 Add Delimiters() 或 Set Delimiters() 消息。
(仅当“语言”选项设置为“英语”、“德语”、“西班牙语”、“法语”或“意大利语”时才可用。)显示一个窗口,您可以在其中添加或删除词干处理例外情况。可以在“用户”、“列”和“本地”水平上应用所做更改。您还可以指定本地例外情况,用于排除在任何其他水平上指定的词干例外情况。请参见词条选项管理窗口。
“词条选项”管理窗口是四个类似的窗口,您可以使用它们来管理停止词、重新编码、短语和词干例外情况的集合。图 12.9显示“管理停止词”窗口。“管理短语”和“管理词干例外情况”窗口与“管理停止词”窗口相同。“管理重新编码”窗口略有不同。请参见管理重新编码。
图 12.9 “管理停止词”窗口
用户逻辑库文件位于 TextExplorer 目录中。该目录的位置基于计算机的操作系统:
•
|
Windows:"C:/Users/<用户名>/AppData/Roaming/SAS/JMP/TextExplorer/<语言>/"
|
•
|
Macintosh:"/Users/<用户名>/Library/Application Support/JMP/TextExplorer/<语言>/"
|
主用户逻辑库文件位于 TextExplorer 目录本身中。这些文件不是语言特定的。
项目文件位于该项目的 TextExplorer 文件夹中。
点击确定后,对“用户”、“项目”和“列”列表的更改将分别保存到用户逻辑库、项目和列属性中。仅当保存“文本分析器”报表的脚本时,才保存在“本地”和“本地例外情况”列表中指定的所有内容。
若将停止词保存到用户逻辑库,则该文件名为 stopwords.txt。若保存到列属性,则该属性称为“停止词”。
若将重新编码保存到用户逻辑库,则该文件名为 recodes.txt。若保存到列属性,则该属性称为“重新编码”。
若将短语保存到用户逻辑库,则该文件名为 phrases.txt。若保存到列属性,则该属性称为“短语”。
若将词干例外情况保存到用户逻辑库,则该文件名为 stemExceptions.txt。若保存到列属性,则该属性称为“词干例外情况”。