探索性数据分析概述
解决行业问题的统计思维
免费的在线统计学课程
探索性数据分析
探索性数据分析 (EDA) 是一个调查过程,在这个过程中,您可以使用汇总统计量和图形工具来获悉您的数据,并了解您可以从中学到什么。
通过 EDA,您可发现数据中的模式,了解变量之间的潜在关系,并找到异常现象,如离群值或异常观测。其目标是产生可以使用更正式的统计方法进行检验的有趣问题或假设。
本模块涵盖的特定主题包括:
描述数据
- 描述性统计量的介绍
- 数据类型
- 直方图
- 集中趋势和位置的测量
- 离差的测量 — 极差和四分位数间距
- 离差的测量 — 方差和标准差
- 可视化连续型数据
- 描述类别型数据
概率概念
- 概率概念的介绍
- 样本和总体
- 了解正态分布
- 正态性检验
- 中心极限定理
用于解决问题的探索性数据分析
- 探索性数据分析的介绍
- 探索连续型数据:增强工具
- Pareto 图
- 堆叠条形图和数据过滤
- 树状图和马赛克图
- 使用格状图和叠加变量
- 气泡图和热图
- 探索性数据分析工具的汇总
与数据沟通
- 与数据沟通的介绍
- 创建有效可视化
- 评估可视化的有效性
- 设计有效可视化
- 用动画进行可视化沟通
- 针对受众进行设计
- 了解目标受众
- 设计用于沟通的可视化
- 设计可视化:注意事项
保存和分享结果
- 保存和分享结果的介绍
- JMP 内部的保存和分享结果
- JMP 外部的保存和分享结果
- 决定使用何种格式
准备数据进行分析
- 数据表的要点
- 常见的数据质量问题
- 识别数据表中的问题
- 识别问题(单次单变量)
- 重构数据进行分析
- 合并数据
- 衍生新变量
- 处理日期