「多変量埋め込み」プラットフォームを起動するには、[分析]>[多変量]>[多変量埋め込み]を選択します。
図11.3 「多変量埋め込み」起動ウィンドウ
「列の選択」の赤い三角ボタンのメニューのオプションについては、『JMPの使用法』の列フィルタメニューを参照してください。「多変量埋め込み」起動ウィンドウには、次のようなオプションがあります。
Y, 列
低次元空間にマッピングしたい高次元データの列を指定します。
By
別々に分析を行いたいときに、そのグループ分けをする変数を指定します。指定された列の水準ごとに、別々に分析が行われます。各水準の結果は別々のレポートに表示されます。複数のBy変数を割り当てた場合、それらのBy変数の水準の組み合わせごとに個別に分析が行われます。
手法
データを低次元空間に写像する方法として、[UMAP]と[t-SNE]のいずれかを選択できます。なお、[UMAP]はJMP17.1に追加され、JMP17.1からはデフォルトが[UMAP]になっています。
次元削減後の次元
写像先の低次元空間の次元数を指定します。2以上の整数を指定してください。
標準化
次元削減に使用する距離の計算前に、データを内部で標準化します。
欠測値の補完
次元削減の計算を行う前に、多変量特異値分解法を使って欠測値を補完します。
メモ: 欠測値があるデータに対して、このオプションを選択しなかった場合は、[OK]をクリックすると補完するかどうかを確認するウィンドウが表示されます。すべての行に欠測値が1つ以上ある場合は、欠測値を補完するか、[Y, 列]に指定する列を変更するか、または分析をキャンセルできます。欠測値がない行がいくつかある場合は、欠測値が補完されます。
詳細オプション
t-SNEアルゴリズムで使用するオプションが含まれます。主なオプションについては、「多変量埋め込み」プラットフォームの統計的詳細で説明します。
疎
高次元空間における条件付き確率の計算で、疎なデータに対する手法(sparse method)を使用します。この手法は、高次元データの計算を可能にします。
パープレキシティ
類似度の計算で使用するパープレキシティの値を指定します。パープレキシティのパラメータ値は5~50の間で、標本サイズの8分の1以下であるものが良いでしょう。デフォルト値は、標本サイズの8分の1です(ただし、この値が30より大きい場合は、30がデフォルト値になります)。
最大反復回数
計算における反復回数の最大値を指定します。
初期主成分の次元
乱択主成分分析の最初のステップで保持する次元数を指定します。デフォルト値は50です。
収束基準
収束の測定に使用する値を指定します。デフォルト値は1e-8です。
初期スケール
求められた成分の初期スケールを指定します。デフォルト値は0.0001です。
イータ
計算における学習率の値を指定します。デフォルト値は200です。
誇張処理の反復回数
モーメンタム値の誇張処理の反復回数を指定します。デフォルト値は250です。
乱数シード値
乱数シード値を指定します。乱数シード値を指定することにより、プラットフォームを新たに起動したときに同じ結果を再現できる。