公開日: 11/25/2021

Image shown here感情分析

感情分析は、辞書に基づいて文書内の感情語を特定し、それらの語に対して、肯定的・否定的・全体的なスコアを付けます。JMPの感情分析は、英語のみしか扱えません。JMPの感情分析では、「各文書において、1つのトピックに対して2項対立な感情が自由記述形式で表されている」と仮定しています。感情分析では、基本的な自然言語処理(NLP)を使用しています。自然言語処理の詳細については、https://opennlp.apache.org/を参照してください。自然言語処理を使用したくない場合は、[文書の解析]オプションの選択を解除してください。

ヒント: 感情分析の例については、[ヘルプ]>[サンプルデータライブラリ]を選択し、「Chips.jmp」を開いて、「テキストエクスプローラ: 感情分析」スクリプトを実行してください。

メモ:

JMPの感情分析では、1つ1つの単語が、否定・強意・感情のいずれか1つだけの表現をしていると仮定しています。

感情分析では、ひとまとまりの文字列を、何らかの感情として認識します。「感情語」レポートまたは「感情語の管理」ウィンドウで、JMPで予め提供している感情語(ビルトインの感情語)とそのデフォルトのスコアを確認できます。

ストップワードに指定されている単語を、否定語・強意語・感情語のいずれかに指定した場合、「感情分析」レポートを開いている間だけ、その単語はストップワードから除外されます。この一時的な除外は、「テキストエクスプローラ」レポート全体に適用されます。「感情分析」レポートを閉じると、その単語は再びストップワードに追加されます。

Image shown here「感情分析」レポート

「テキストエクスプローラ」プラットフォームの「感情分析」レポートは、デフォルトでは、「感情の要約」レポートのみが開かれた状態となっています。その他のレポートは、デフォルトでは閉じています。

図12.13 「感情分析」レポート 

Sentiment Analysis Report

「感情分析」レポートには、次のレポートが含まれます。

否定語

現在の感情分析に含まれる否定語の一覧です。この一覧を右クリックすると、オプションが表示されます。一覧中の否定語を選択して、削除することもできます。

強意語

強意語およびその乗数の一覧が表示されます。一覧を右クリックすると、オプションが表示されます。一覧中の強意語を選択して、削除することもできます。

感情語

感情語およびそのスコアの一覧が表示されます。感情語を新しく追加することもできます。「考えられる感情」表に、感情語の候補とその度数が表示されているので、その表から単語を選択し、「+感情」の下にあるボタンのいずれかをクリックすると、その単語を感情語として追加できます。ボタンに示されている値以外のスコアを指定するには、感情語の一覧に追加してから、スコアの数値を編集してください。

「考えられる感情」表の単語を選択すると、その単語を含む文書が右側に表示されるので、コーパス内でその単語が使用された文脈を確認できます。

特徴

コーパス内の特徴にスコアをつけるオプションがあります。特徴とは、感情語によって形容や説明されている単語です。[検索]ボタンをクリックすると、考えられる特徴の一覧が表示されます。「考えられる特徴」表から語句を1つまたは複数選択すると、右側のテキストボックスにその語句を含む文書の該当部分が表示されます。[選択されている特徴にスコアをつける]ボタンをクリックすると、選択した特徴にスコアをつけた結果が「感情の要約」レポートに表示されます。

メモ: [文書の解析]オプションを選択すると、感情語と同じ節内で使用されている特徴にスコアがつけられます。

感情の要約

「感情の要約」レポートには、現在の設定に基づいて感情分析を行った結果が表示されます。このレポートには、要約の表およびヒストグラム、文書スコアの表、感情語の表、テキストボックス、および、感情語と強意語を追加するための設定パネルが表示されます。

要約の表には、スコアの基準別に文書数とスコア平均が表示されます。スコア平均は、[スコアリング]オプションの設定に従います。「感情分析」レポートのオプションを参照してください。要約のヒストグラムには、文書の全体的な感情スコアの分布が表示されます。このヒストグラムは対話的に操作できます。棒をクリックすると、文書スコアの表で該当文書が強調表示されます。

文書スコアの表には、各文書の肯定的感情および否定的感情のスコアの合計および平均と、全体的な感情スコアが表示されます。この表で行を選択すると、表の下のテキストボックスにその文書のテキストが表示されます。[スコア列]を指定した場合は、そのスコア列の値も表に表示されます。

ヒント: 文書スコアの表で、カーソルをセルに合わせると、スコアの計算が表示されます。

感情語の表には、感情語ごとにスコアと度数(コーパス内での出現数)が表示されます。

ヒント: 感情語が複数の単語から構成される場合は、その感情語の「スコア」列のセルにカーソルを合わせると、どのようにスコアが計算されているかを示す計算式が表示されます。

テキストボックスには、文書スコアの表で選択した文書のテキストか、感情語の表で選択した感情語の文が表示されます。文書スコアの表で文書を選択すると、その文書に含まれる感情の一覧がテキストボックスの右側に表示されます。

ヒント: テキストボックスで、否定語・強意語・感情語のいずれかに分類される語句にカーソルを合わせると、その分類と[削除]ボタンが表示されます。[削除]ボタンをクリックすると、その語句を分類から除外できます。

テキストボックスで単語を選択すると、設定パネルが有効になります。その選択した単語を感情語として追加するには、テキストボックス内で単語を選択し、「+感情」の下のいずれかのボタンをクリックします。単語を強意語として追加するには、テキストボックス内で単語を選択し、「×強意語」の下のボタンをクリックします。

Image shown here「感情分析」レポートのオプション

「感情分析」レポートの赤い三角ボタンをクリックすると、以下のオプションが表示されます。

スコアリング

文書の全体スコアの計算方法を指定します。次のオプションがあります。

尺度化

肯定的な語句と否定的な語句のスコアを合計し、その合計値を文書に含まれる語句の数で割った値を、全体スコアとします。

最小値/最大値

肯定的スコアの最大値と、否定的スコアの最小値の合計を、全体スコアとします。

スコア列

算出された感情との比較対象となる既知の情報が含まれているデータテーブルの列を指定します。指定したスコア列は、文書スコアの表に追加されます。

ヒント: スコア列と全体スコアの列をグラフで比較すると、感情スコアの検討に役立ちます。

文書の解析

文書の解析に自然言語処理(NLP)を使用するかどうかを指定します。自然言語処理の詳細については、https://opennlp.apache.org/を参照してください。

文書のスコアを保存

文書スコアの列を、データテーブルに追加します。肯定的感情の合計、否定的感情の合計、肯定的感情の平均、否定的感情の平均、全体的感情の各スコアが、データテーブルに新しい列として追加されます。

文書別に感情スコアの度数を保存

感情語の列をデータテーブルに追加します。追加された各列には、文書内でのその感情語の出現回数が含まれます。

否定語の表示

「否定語」レポートの表示/非表示を切り替えます。

強意語の表示

「強意語」レポートの表示/非表示を切り替えます。

感情語の表示

「感情語」レポートの表示/非表示を切り替えます。

特徴検索の表示

「特徴」レポートの表示/非表示を切り替えます。

感情クラウドの表示

「感情の要約」レポートにおいて、感情語の単語クラウドの表示/非表示を切り替えます。

ビルトインの否定語を含める

感情分析で使用する否定語に、ビルトインの否定語を含めるかどうかを指定します。

ビルトインの強意語を含める

感情分析で使用する強意語に、ビルトインの強意語を含めるかどうかを指定します。

ビルトインの感情語を含める

感情分析で使用する感情語に、ビルトインの感情語を含めるかどうかを指定します。

否定語の管理

否定語の追加や削除を行うウィンドウを表示します。保存場所(スコープ)としては、「ユーザ」・「列」・「ローカル」があります。「ローカルの例外」では、いずれかの保存場所で指定された否定語をローカルでは除外することができます。[単語のオプション]から開く管理ウィンドウを参照してください。

強意語の管理

強意語の追加や削除を行うウィンドウを表示します。保存場所(スコープ)としては、「ユーザ」・「列」・「ローカル」があります。「ローカルの例外」では、いずれかの保存場所で指定された強意語をローカルでは除外することができます。[単語のオプション]から開く管理ウィンドウを参照してください。

感情語の管理

感情語の追加や削除を行うウィンドウを表示します。保存場所(スコープ)としては、「ユーザ」・「列」・「ローカル」があります。「ローカルの例外」では、いずれかの保存場所で指定された感情語をローカルでは除外することができます。[単語のオプション]から開く管理ウィンドウを参照してください。

より詳細な情報が必要な場合や、質問があるときは、JMPユーザーコミュニティで答えを見つけましょう (community.jmp.com).