基本的な統計分析 > テキストエクスプローラ
公開日: 11/25/2021

テキストエクスプローラ

非構造化テキストを探索する

Image shown hereこのプラットフォームの機能の多くは、JMP Proだけの機能です。JMP Proだけで動作する機能の説明には、このマークが付いています。

「テキストエクスプローラ」は、アンケート調査の自由回答や、医療現場のインシデントレポートなど、構造化されてないテキストデータを分析するためのプラットフォームです。このツールを使って、似ている単語を1つにまとめたり、誤っている語句を再コード化したりできます。また、テキストデータにおける単語の出現頻度を把握できます。

Image shown hereJMP Proでは、特異値分解に基づいて、似ている文書をトピックごとに分類することができます。特異値分解の結果をもとに、同じ単語が使われている文書や、1つの文書内で一緒に使われていることが多い単語を、クラスターにまとめることができます。また、潜在クラス分析によっても文書をクラスターに分けることができます。

Image shown hereJMP Proでは、文書に含まれる重要な単語や感情を特定することもできます。単語選択分析は、ある応答変数を最もよく説明する単語を特定します。感情分析は、辞書に基づいて文書内の感情語を特定し、それらの語に対して、肯定的・否定的・全体的なスコアを付けます。感情分析は、基本的な自然言語処理(NLP)にも対応しています。ただし、感情分析は英語文書しかサポートしていません。

図12.1 テキストエクスプローラの特異値分解プロット 

SVD Plots in Text Explorer

目次

「テキストエクスプローラ」プラットフォームの概要

テキスト処理の手順

「テキストエクスプローラ」プラットフォームの例

「テキストエクスプローラ」プラットフォームの起動

正規表現エディタでのRegexのカスタマイズ

「テキストエクスプローラ」レポート

要約レポート
単語と句のリスト

「テキストエクスプローラ」プラットフォームのオプション

テキストを前処理するオプション
テキストの統計分析に関するオプション
保存に関するオプション
レポートのオプション

潜在クラス分析

潜在意味分析(特異値分解)

「特異値分解」レポート
「特異値分解」レポートのオプション

トピック分析

「トピック分析」レポート
「トピック分析」レポートのオプション

判別分析

「判別分析」レポート
「判別分析」レポートのオプション

単語選択分析

単語選択分析の設定
「単語選択分析」レポート
「単語選択分析」レポートのオプション

感情分析

「感情分析」レポート
「感情分析」レポートのオプション

「テキストエクスプローラ」プラットフォームの別例

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).