[テキストデータファイル]の環境設定では、テキストファイルの読み込みと書き出しをカスタマイズできます。
図14.14 [テキストデータファイル]の環境設定
環境設定 | 説明 |
---|---|
開くテキストファイルの文字コード | メニューからオプションを1つ選択して、ファイルを開くときに使用する文字エンコーディングを指定します。デフォルト設定は[自動識別]です。一部のシステムでは、Windows-1252がANSIIと見なされることに注意してください。UTF-8-BOMはサポートされていません。 |
テキストファイルをUnicodeで保存 | JMPでは、éや½などの特殊文字を含むUnicode文字セットをサポートしています。特殊なUnicode文字を使用していないファイルは、自動的にプレーンテキストとして保存されます。このオプションはデフォルトでオンになっています。 このチェックボックスをオフにすると、ファイルはすべてプレーンテキスト形式で保存されます。 |
読み込みの設定 | JMPでテキストファイルを開く方法を指定します。デフォルトでは、[これらの設定を使用する]が選択されています。この場合は、読み込むテキストファイルの形式に合った設定を、このウィンドウで指定しておく必要があります。 [形式を識別する]を選択した場合は、テキストファイル内のタブ・カンマ・空白などの文字がカウントされ、決められたルールに基づいてファイル形式が自動認識されます。ルールに従って、フィールド幅と1行のフィールド数が推測されます。実際のデータの形式が、ルールによって認識可能な形式と大幅に異なる場合は、自動認識が正しく機能しません。その場合は、ウィザードを使用するか、環境設定でデータの形式を指定しておく必要があります。 |
フィールドの終わり | フィールドの末尾を示す区切り文字を選択します(複数選択可)。ここで選択された文字が、テキストファイルの読み込み時に、フィールド末尾の区切り文字として使用されます。デフォルトでは、[タブ]、[カンマ]、および[CSV標準]が選択されています。 リストに表示されていない区切り文字を指定する場合は、[その他]チェックボックスをオンにし、文字を入力します。 |
行の終わり | 行の末尾を示す区切り文字を選択します(複数選択可)。デフォルトでは、[<CR>+<LF>]、[<CR>]、および[<LF>]が選択されています。 リストに表示されていない区切り文字を指定する場合は、[その他]チェックボックスをオンにし、文字を入力します。 テキストデータの読み込み中に二重引用符が検出された場合、区切り文字のルールが変更され、閉じる二重引用符が検索されます。二重引用符のあいだにあるスペースなどの区切り文字はすべて無視され、文字列の一部として扱われます。 |
テーブルに列名を含む | テキストファイルに列名が含まれている場合は、このチェックボックスをオンにします。このオプションを選択した場合は、列名が含まれている行の番号を[列名のある行]の横のフィールドに入力します。このオプションはデフォルトでオンになっています。 |
列名のある行 | [テーブルに列名を含む]チェックボックスをオンにした場合は、列名が含まれている行の番号をこのフィールドに入力します。デフォルト設定は行1です。 |
列名の適用を開始する列 | このオプションには、列名のないデータ列の列番号を入力します。列名の適用を開始する列が何番目であるか指定します。デフォルト設定は列1です。 |
データの開始行 | テキストファイル内でデータが入力されている最初の行の番号を入力します。デフォルト設定は行2です。 |
列の種類の判断 | 列のデータタイプを認識するためにテキストファイルをスキャンする長さを設定します。デフォルトで[ファイル全体をスキャンする]が選択されています。[ファイル全体をスキャンする]オプションを選択した場合は、テキストファイルが大きいときは読み込みに時間がかかります。[5秒間スキャンする]への変更を検討してください。 すべての値が欠測値となっている列がテキストファイルに含まれている場合、[空の列を数値タイプとする]を選択すると、それらの列が、文字型ではなく、数値型として読み込まれます。ピリオド、Unicodeのドット、NaN、または、空の文字列は欠測値と見なされます。このオプションは、デフォルトではオフになっています。 |
2桁の年表記ルール | 日付の年が、4桁ではなく、2桁で表記されている場合に、日付の読み込みに使用するルールを選択します。デフォルト設定は[2000-2099]です。 これらのルールの詳細については、2桁の年表記ルールを参照してください。 |
圧縮を試みる | テキストファイルの圧縮に使用するオプションを選択します。以下のオプションがあり、デフォルトではすべてのオプションがオフになっています。 • 数値タイプの列 • 文字タイプの列 • リストチェックを設定する メモ: この機能を使用する場合、ファイル全体のスキャンが必要です。 |
引用符を取り除く | テキストファイル内でデータを囲んでいる引用符を、読み込み時に削除する場合は、このチェックボックスをオンにします。このオプションはデフォルトでオンになっています。 |
アポストロフィを引用符として識別(推奨しない) | アポストロフィを引用符として扱い、省略するには、このオプションをオンにします。このオプションは、デフォルトではオフになっています。 メモ: テキストデータが標準的な形式ではなく、フィールドが引用符ではなくアポストロフィで囲まれている場合以外、このオプションは推奨されません。 |
地域の設定を使用 | テキストファイルを読み込む際にオペレーティングシステムの地域の設定を使用する場合は、このチェックボックスをオンにします。 • このオプションがオフになっている場合(デフォルト設定)、小数点にピリオド、および値の区切り記号にカンマを使用しているファイルは正しく読み込まれます。 • ファイルが小数点にカンマを使用していて、値の区切り記号がカンマ以外の場合(かつ地域の設定が小数点にカンマを使用している場合)は、このオプションを選択すると、テキストが正しく読み込まれます。[テキストデータファイル]の環境設定にある「読み込みの設定」でフィールドの区切り文字を指定する必要があります。 |
環境設定 | 説明 |
---|---|
列名の書き出し | データテーブルをテキストファイルとして保存するときに、列名を含める場合は、このチェックボックスをオンにします。このオプションはデフォルトでオンになっています。 |
すべての列名に 引用符を追加する | 列名を引用符で囲む場合は、このチェックボックスをオンにします。CSVより要件が厳しいプログラムで使用するデータを書き出す場合に使用します。このオプションは、デフォルトではオフになっています。 |
すべての文字値に 引用符を追加する | 文字の値を引用符で囲む場合は、このチェックボックスをオンにします。CSVより要件が厳しいプログラムで使用するデータを書き出す場合に使用します。このオプションは、デフォルトではオフになっています。 |
すべての数値に 引用符を追加する | 数値を引用符で囲む場合は、このチェックボックスをオンにします。CSVより要件が厳しいプログラムで使用するデータを書き出す場合に使用します。このオプションは、デフォルトではオフになっています。 |
フィールドの終わり | フィールドの末尾を示す区切り文字を選択します(複数選択可)。ここで選択された文字が、テキストファイルへの書き込み時に、フィールド末尾の区切り文字として使用されます。デフォルト設定は[カンマ]です。 リストに表示されていない区切り文字を指定する場合は、[その他]チェックボックスをオンにし、文字を入力します。 |
行の終わり | 行の末尾を示す区切り文字を選択します(複数選択可)。デフォルト設定は[<CR>+<LF>]です。 リストに表示されていない区切り文字を指定する場合は、[その他]チェックボックスをオンにし、文字を入力します。 |