データの構造

多変量分析 > 階層型クラスター分析 > 「階層型クラスター分析」プラットフォームの起動 > データの構造

公開日: 11/25/2021

データの構造

以下のオプションから、分析に使用されるデータがどのような形式となっているかを選択してください。

通常のデータ

分析に用いるデータが、オブザベーションごとに1行ずつあり、変数ごとに1列ずつある、通常の矩形データの場合には、このオプションを選択します。

要約したデータ

グループごとに平均を計算して、その要約された平均でクラスター分析したい場合には、このオプションを選択します。このオプションを選択すると、起動ウィンドウに［対象のID］ボックスが表示されます。グループ別にしたい列を［対象のID］に指定します。［要約したデータ］オプションは、それらの水準ごとに平均を計算し、それらを入力データとして扱います。

データは距離行列

データが距離を表している場合には、このオプションを選択します。対象がn個の場合、この距離データにはn個の行とn + 1個の列が必要です。1つの列（通常は第1列目）には、n個のオブザベーションそれぞれを一意に識別する値が含まれている必要があります。それ以外の列は、対象と対象との間の距離を表すn個の値が含まれている必要があります。次のような検証が行われます。

– ある点とその点自身との距離は0であるため、距離データの対角要素はすべて0です。0以外の値または欠測値は0として扱われ、レポートにその旨が記載されます。

– 距離データは、対称な正方行列か、欠測値を下側に含む上三角行列か、または、欠測値を上側に含む下三角行列でなければいけません。正方行列を使用する場合は、行列が対称でないと警告が表示されます。

– 別の形式のデータで分析をして、そこで距離行列を保存することもできます。距離行列の保存を参照してください。

［データは距離行列］オプションを選択した場合は、距離を含む列を［Y, 列］に指定し、識別する値を含む列を［ラベル］に指定します。［ラベル］に指定する列には文字型のデータが含まれている必要があります。例については、距離行列の例を参照してください。

積み重ねたデータ

関心のある応答が1つだけで、各対象に複数の行があるデータの場合は、このオプションを選択します。

［積み重ねたデータ］オプションを選択すると、起動ウィンドウに［属性のID］テキストボックスと［対象のID］テキストボックスが表示されます。

– 1つの列を［Y, 列］に指定します。

– ［Y, 列］変数のグループ化を説明する列を［属性のID］に指定します。2列だけを入力し、［空間的な指標の計算］を選択した場合は、クラスターの分析に使用する空間的な指標を追加できます。空間的な指標の計算を参照してください。

– 識別する値を含む列を［対象のID］に指定します。

このオプションで実行される分析の結果は、「Y, 列」変数を「属性のID」列で分割し、応答列を標準化せずに階層型クラスター分析を実行した場合と同じです。

ヒント: 2次元座標での観測値を分析する場合には、このオプションとともに［空間的な指標の計算］オプションも役立ちます。たとえば、ウエハーのダイごとに、1行ずつデータが記録されていたとします。この機能を用いると、ウエハーを空間的な指標を用いてクラスタリングできます。空間的な指標でウエハーの不適合をクラスタリングする例を参照してください。

注意: ［積み重ねたデータ］で分析されるデータは、観測値が共通した1変数だけで測定されているので、多くの場合、［データの標準化］オプションは適切ではありません。

「欠測値でないデータが不足しています。」の警告

［要約したデータ］または［積み重ねたデータ］を使用している場合は、「欠測値でないデータが不足しています。」というJMPの警告の意味がわかりにくいかもしれません。この警告は、以下のような場合に表示されます。

• ［通常のデータ］では、0～1行以外のすべての行において、「Y, 列」変数の少なくとも1つが欠測値となっている場合。

• ［要約したデータ］では、「対象のID」列で要約したときに、0～1行以外のすべての行において、要約された「Y, 列」変数の少なくとも1つが欠測値の場合。クラスター分析されるデータを確認するには、［テーブル］>［要約］を選択し、「対象のID」列を［グループ化］に、「Y, 列」変数を［統計量］>［平均］に指定してください。

• ［積み重ねたデータ］では、「属性のID」列で分割したときに、0～1行以外のすべての行において、分割された「Y, 列」変数の少なくとも1つが欠測値の場合。クラスター分析されるデータを確認するには、［テーブル］>［列の分割］を選択し、「属性のID」列を［分割する列］に、「Y, 列」変数を［分割する列］に、「対象のID」列を［グループ化］に指定してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).