「多変量埋め込み」プラットフォームの概要

「多変量埋め込み」プラットフォームでは、高次元空間の点{x1, x2, ..., xn}を低次元空間の点{y1, y2, ..., yn}に写像することで、次元削減を行います。その際、高次元データに含まれる重要な情報をできるだけそのまま維持するように次元を削減します。「多変量埋め込み」プラットフォームでは、t-SNE（t分布型確率的近傍埋め込み法; t-Distributed Stochastic Neighbor Embedding）を行えます。また、JMP17.1より、UMAP（一様多様体近似と射影; Uniform Manifold Approximation and Projection）も行えます。t-SNE法は、確率的近傍埋め込み法（Stochastic Neighbour Embedding; Hinton and Roweis, 2002）の一種です。

t-SNE法は、点のペアの類似度に基づいています。t-SNE法での各ペアの類似度は、2点の条件付き確率によって表されます。高次元空間では、Gauss分布を使って、2点間の距離を条件付き確率に変換します。低次元マップでは、自由度が1のStudentのt分布を使って、2点間の距離を条件付き確率に変換します。t-SNE法という名前は、そのような計算に由来しています（van der Maaten and Hinton, 2008）。

低次元への写像が適切である場合は、高次元空間における{xi, xj}のペアの類似度と、低次元空間における{yi, yj}のペアの類似度が一致しています。t-SNE法ではこの前提に基づき、高次元の類似度と低次元の類似度の違いがなるべく小さくなるように次元削減を行います。この違いを測るのには、Kullback-Leibler情報量の一種を使用します。そして、最急降下法を使って、その値を最小化します。t-SNE法の詳細については、「多変量埋め込み」プラットフォームの統計的詳細を参照してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).