このプラットフォームの機能の多くは、JMP Proだけの機能です。JMP Proだけで動作する機能の説明には、このマークが付いています。
「テキストエクスプローラ」は、アンケート調査の自由回答や、医療現場のインシデントレポートなど、構造化されてないテキストデータを分析するためのプラットフォームです。このツールを使って、似ている単語を1つにまとめたり、誤っている語句を再コード化したりできます。また、テキストデータにおける単語の出現頻度を把握できます。
JMP Proでは、特異値分解に基づいて、似ている文書をトピックごとに分類することができます。特異値分解の結果をもとに、同じ単語が使われている文書や、1つの文書内で一緒に使われていることが多い単語を、クラスターにまとめることができます。また、潜在クラス分析によっても文書をクラスターに分けることができます。
JMP Proでは、文書に含まれる重要な単語や感情を特定することもできます。単語選択分析は、ある応答変数を最もよく説明する単語を特定します。感情分析は、辞書に基づいて文書内の感情語を特定し、それらの語に対して、肯定的・否定的・全体的なスコアを付けます。感情分析は、基本的な自然言語処理(NLP)にも対応しています。ただし、感情分析は英語文書しかサポートしていません。
図12.1 テキストエクスプローラの特異値分解プロット