Statistical Thinking for Industrial Problem Solving

無料のオンライン統計コース

探索的データ分析

探索的データ分析(EDA)は、要約統計量およびグラフ化ツールを使用して、データを把握し、データから得られる知見を理解する調査プロセスです。

EDAを使用すると、データのパターンを解明し、変数間の潜在的な関係を把握し、外れ値や異常な観測値などの異常を発見することができます。目標は、より正式な統計手法を使用してテストできる興味深い質問や仮説を生み出すことです。

このモジュールで扱う具体的なトピック:

データの説明

  • 記述統計量の概要
  • データの種類
  • ヒストグラム
  • 中心的な傾向と中心の位置の指標
  • 散らばりの指標 — 範囲と四分位範囲
  • 散らばりの指標 — 分散と標準偏差
  • 連続データの視覚化
  • カテゴリカルデータの説明

確率の考え方

  • 確率についての簡単な説明
  • 標本と母集団
  • 正規分布について
  • 正規性の確認
  • 中心極限定理

問題解決のための探索的データ分析

  • 探索的データ分析の概要
  • 連続データに対するグラフ: 追加の処理
  • パレート図
  • 詰め込み棒グラフとデータフィルタリング
  • ツリーマップおよびモザイク図
  • トレリスプロットと重ね合わせプロット
  • バブルプロットとヒートマップ
  • 探索的データの要約

データを用いたコミュニケーション

  • データを用いたコミュニケーションの概要
  • 効果的な視覚的表現の作成
  • グラフが効果的かどうかの評価
  • 効果的なグラフのデザイン
  • アニメーションによる視覚的な伝達
  • 対象者に向けたデザイン
  • 対象者の理解
  • コミュニケーションのための視覚的表現のデザイン
  • 視覚的表現のデザイン: 推奨事項と禁止事項

結果の保存と共有

  • 結果の保存と共有の概要
  • JMPでの結果の保存と共有
  • JMP以外での結果の保存と共有
  • 使用する形式の決定

分析用のデータ準備

  • データテーブルの基本
  • データ品質でよく生じる問題
  • データテーブルでの問題の特定
  • 1変数ずつ確認して問題を特定する
  • 分析のためにデータを再構成する
  • データの結合
  • 新しい変数の作成
  • 日付の操作