使用 JMP > JMP 首选项 > 文本数据文件
发布日期: 04/13/2021

文本数据文件

“文本数据文件”首选项用于定制导入和导出文本文件。

图 13.9 “文本数据文件”首选项 

Image shown here

表 13.8 文本文件的“导入设置”首选项 

首选项

说明

打开文本文件字符集

选择菜单中的一个选项以确定 JMP 打开文件时使用的字符编码。“最佳推测”为默认设置。请注意:Windows-1252 在某些系统上被视为 ANSII,并且不支持 UTF-8-BOM。

以 Unicode 编码保存文本文件

JMP 使用 Unicode 字符集,该字符集支持特殊字符,如 é 和 ½。它将不含特殊的 Unicode 字符的文件自动以纯文本格式保存。默认选定该选项。

清除该复选框可将您的所有文件以纯文本格式保存。

导入设置

选择 JMP 用于打开文本文件的策略。默认选择使用以下设置。在这种情况下,您需要确保设置反映您的文本文件情况。

若您选择使用最佳推测,JMP 将在文本文件中收集有关制表符、逗号、空格和其他几个字符的统计信息,并使用基于规则的系统确定可能的文件格式。这些规则尝试指定合理的字段宽度和每行合理的字段数。若您的数据格式与规则设计来推测的格式有很大区别,则 JMP 推测不正确。在这种情况下,请使用向导或在这些首选项设置中明确描述您的数据。

字段结尾

选择一个或多个字符,用作导入文本数据时指示字段结尾的分隔符。

选择其他选项并输入一个字符可指定未列出的分隔符。

行结尾

选择一个或多个字符,用作指示行结尾的分隔符。

选择其他选项并输入一个字符可指定未列出的分隔符。

请注意,若在导入文本数据时遇到双引号,则分隔符规则会更改以查找结束双引号。其他文本分隔符(包括引号中嵌入的空格)将被忽略,并视为文本字符串的一部分。

表包含列标题

若您的文本文件包含列名,则选择该选项。若选择该选项,请在列名位于行旁边的字段中输入列名所在的行号。

列名位于行

若选择表包含列标题选项,请在该字段中输入列名所在的行号。

数据开始于行

输入数据在您的文本文件中开始的行号。

确定列类型时

设置 JMP 扫描文本文件以确定列的数据类型的时长。默认选定扫描整个文件。请注意,对于大文件,扫描整个文件选项可能导致导入文本文件变慢。考虑选择扫描 5 秒

文本文件包含缺失数据的列时,选择将空列视为数值列可将这些列作为数值列而非字符列导入。点、Unicode 点、NaN 或空字符串为可能的缺失值指示符。默认取消选择该选项。

两位数年份规则

选择要用于导入日期的规则,该日期使用两位数而非四位数的年份。有关这些规则的详细信息,请参见两位数年份规则

尝试压缩

选择用于压缩文本文件的选项。可用选项包括:

数值列

字符列

允许列表检查

注意:该功能需要对整个文件进行扫描。

去除外围引号

选择该选项可删除文本文件中括起数据的引号。默认选定该选项。

将撇号识别为引号

选择该选项可将撇号视为引号并忽略它们。默认关闭该选项。

注意:不推荐使用该选项,除非您的数据来自非标准源,该源使用撇号而非引号括起数据字段。

使用区域设置

选择该选项可在导入文本文件时使用操作系统的区域设置。

若取消选定该选项(默认设置),用句点表示小数点和用逗号表示值分隔符的文件将正确导入。

若该文件用逗号表示小数点并使用其他某种值分隔符(并且区域设置用逗号表示小数点),则选择该选项可正确导入文本。您必须在“文本数据文件”导入首选项中指定值分隔符。

表 13.9 文本文件的“导出设置”首选项 

首选项

说明

导出表标题

选择该选项可在将数据表保存为文本文件时包括列名。默认选定该选项。

为所有列名添加引号

选择该选项可在列名周围插入引号。用于将数据导出到要求比 CSV 更严格的程序中。

为所有字符值添加引号

选择该选项可在字符值周围插入引号。用于将数据导出到要求比 CSV 更严格的程序中。

为所有数值添加引号

选择该选项可在数值周围插入引号。用于将数据导出到要求比 CSV 更严格的程序中。

字段结尾

选择一个或多个字符,用作导出文本数据时指示字段结尾的分隔符。

选择其他选项并输入一个字符可指定未列出的分隔符。

行结尾

选择一个或多个字符,用作指示行结尾的分隔符。

选择其他选项并输入一个字符可指定未列出的分隔符。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).