[カテゴリ化の計算式の作成]オプションを使用して、データを等幅のビン(棒)に分類(カテゴリ化)できます。カテゴリ化したい列を1列または複数列選択して、[列]>[ユーティリティ]>[カテゴリ化の計算式の作成]を選択します。新しい計算式の列がデータテーブルに追加されます。
「カテゴリ化」ウィンドウには次のオプションがあります。
表示形式
ビンの範囲の表示形式を選択します。グラフ上でカーソルを移動してプレビューを表示できます。
カテゴリ化の設定: オフセット
ビンの下限のオフセット値を選択します。
注: ビンはそれぞれ下限値に基づいて区別されます。下限値はビンに含まれ、上限値は次のビンの下限値に相当するため、次のビンに含まれます。
カテゴリ化の設定: 幅
ビンの値の幅を入力します。
注: 指定したオフセットと幅の値より、ビンを色分けして表示します。
ラベル
データ値の変わりに値ラベルを表示するかどうかを指定します。
値ラベルの使用
値の代わりにラベルを表示します。
範囲ラベルの使用
ラベルに各範囲の下限値と上限値を含めます。
ラベルなし
ラベルとして下限値を使用します。
値ラベルを参照してください。
ヒント: ほとんどのプラットフォームで値ラベルを使用することをお勧めします。範囲ラベルは多くのプラットフォームでサポートされていません。「カテゴリカル」プラットフォームでは、値ラベルを使用しなければなりません。軸によって、範囲ラベルの方が値を識別しやすいケースがあります。そのような場合は、軸のオフセットや幅を調整することもできます。
すべてXと同じ設定で作成
(複数の列が選択されている場合にのみ表示)最初の列(X)に対する選択内容を残りの列にも適用します。
計算列の作成
計算列を作成し、ウィンドウを閉じます。
1. [ヘルプ]>[サンプルデータライブラリ]を選択し、「Big Class.jmp」を開きます。
2. 「身長(インチ)」列を選択します。
3. [列]>[ユーティリティ]>[カテゴリ化の計算式の作成]を選択します。
値の範囲は「X-X」として表示したいので、範囲設定は[下限-上限]のままにしておきます。
4. 「オフセット」を「-0.5」に変更します。
ヒント: 整数データの場合、オフセットを「-0.5」に設定すると、境界線上の値を明確にカテゴリ分けできます。この例では、ビンの1つの範囲が59.5から64.5となっているので、59と65はこのビンに含まれないことがはっきりします。
5. 「幅」は「5」に設定したままにします。
6. ラベルについては、[値ラベルの使用]に設定したままにし、ビンに該当する値の範囲を確認できるようにします。
図4.36 設定後の「カテゴリ化」ウィンドウ
7. [計算列の作成]をクリックします。
「カテゴリ化 身長(インチ)」という列が「Big Class.jmp」データテーブルに追加されます。
8. 計算式を確認するには、「カテゴリ化 身長(インチ)」列を右クリックして[計算式]を選択します。
図4.37 計算式