解决行业问题的统计思维

免费的在线统计学课程

课程纲要

《解决行业问题的统计思维》课程由七个模块组成,共计约 30 小时的自行掌控进度的学习。每个模块都包括教学短视频、JMP 演示、问题和练习。每个模块所涵盖的主题如下所述。

按模块来探索主题(或下载 PDF 版本):

统计思维与问题解决

统计思维

  • 什么是统计思维

问题解决

  • 问题解决的概览
  • 解决问题的统计方法
  • 问题类型

定义问题

  • 定义问题
  • 目标与关键绩效指标
  • 白色聚合物案例研究

定义过程

  • 什么是过程?
  • 制定 SIPOC 图
  • 制定输入/输出过程图
  • 自上而下流程图和部署流程图

识别潜在的根本原因

  • 识别潜在原因的工具
  • 头脑风暴
  • 多轮投票
  • 使用亲和图
  • 因果图
  • 五个为什么
  • 因果矩阵

编制和收集数据

  • 用于解决问题的数据收集
  • 数据类型
  • 可操作的定义
  • 数据收集的策略
  • 导入数据进行分析
探索性数据分析

描述数据

  • 描述性统计量的介绍
  • 数据类型
  • 直方图
  • 集中趋势和位置的测量
  • 离差的测量 — 极差和四分位数间距
  • 离差的测量 — 方差和标准差
  • 可视化连续型数据
  • 描述类别型数据

概率概念

  • 概率概念的介绍
  • 样本和总体
  • 了解正态分布
  • 检验正态性
  • 中心极限定理

用于解决问题的探索性数据分析

  • 探索性数据分析的介绍
  • 探索连续型数据:增强工具
  • Pareto 图
  • 堆叠条形图和数据过滤
  • 树状图和马赛克图
  • 使用格状图和叠加变量
  • 气泡图和热图
  • 探索性数据分析工具的汇总

与数据沟通

  • 与数据沟通的介绍
  • 创建有效可视化
  • 评估可视化的有效性
  • 设计有效可视化
  • 用动画进行可视化沟通
  • 针对受众进行设计
  • 了解目标受众
  • 设计用于沟通的可视化
  • 设计可视化:注意事项

保存和分享结果

  • 保存和分享结果介绍
  • JMP 内部的保存和分享结果
  • JMP 外部的保存和分享结果
  • 决定使用何种格式

准备数据进行分析

  • 数据表要点
  • 常见数据质量问题
  • 识别数据表中的问题
  • 识别问题(单次单变量)
  • 重构数据进行分析
  • 合并数据
  • 衍生新变量
  • 处理日期
质量方法

统计过程控制

  • 控制图的介绍
  • 单值和移动极差控制图
  • 常见原因变异与特殊原因变异
  • 特殊原因的检验
  • 均值-极差控制图与均值-标准差控制图
  • 合理子组化
  • 三因子控制图
  • 分阶段的控制图

过程能力

  • 客户的声音
  • 过程能力指标
  • 能力的短期和长期估计
  • 了解过程改进的能力
  • 估计过程能力:示例
  • 计算非正态数据的能力
  • 估计多个变量的过程能力
  • 识别性能差的过程
  • 行业视角

测量系统研究

  • 什么是测量系统分析 (MSA)?
  • 语言和术语
  • 设计测量系统研究
  • 设计和执行 MSA
  • 分析 MSA
  • 研究测量系统准确度
  • 改进测量过程
利用数据做出决策

估计

  • 统计推断的介绍
  • 什么是置信区间?
  • 估计平均值
  • 可视化抽样变异
  • 构建置信区间
  • 了解置信水平和 Alpha 风险
  • 预测区间
  • 容差区间
  • 比较区间估计

统计检验的基础

  • 统计检验的介绍
  • 统计决策
  • 了解原假设和备择假设
  • 原假设下的抽样分布
  • p 值和统计显著性

连续型数据的假设检验

  • 执行单样本 t 检验
  • 了解 p 值和 t 比值
  • 等价性检验
  • 比较两个平均值
  • 不等方差检验
  • 成对观测
  • 单因子 ANOVA(方差分析)
  • 多重比较
  • 统计显著性与实际显著性

样本大小与功效

  • 样本大小与功效的介绍
  • 均值置信区间的样本大小
  • 统计检验的结果
  • 统计功效
  • 探索样本大小与功效
  • 计算单样本 t 检验的样本大小
  • 计算双样本 t 检验和方差分析的样本大小
相关性与回归

相关性

  • 什么是相关性?
  • 解释相关性

简单线性回归

  • 回归分析的介绍
  • 简单线性回归模型
  • 最小二乘法
  • 可视化最小二乘法
  • 回归模型的假定
  • 解释回归结果
  • 使用曲率拟合模型

多元线性回归

  • 什么是多元线性回归?
  • 拟合多元线性回归模型
  • 解释解释建模中的结果
  • 残差分析和离群值
  • 带类别型预测变量的多元线性回归
  • 带交互项的多元线性回归
  • 变量选择
  • 多重共线性

Logistic 回归的介绍

  • 什么是 Logistic 回归?
  • 简单 Logistic 模型
  • 简单 Logistic 回归示例
  • 解释 Logistic 回归结果
  • 多元 Logistic 回归
  • 带交互项的 Logistic 回归
  • 常见问题
实验设计

实验设计的介绍

  • 什么是实验设计?
  • 开展特设实验和单次单因子 (OFAT) 实验
  • 为什么使用实验设计?
  • 实验设计的术语
  • 实验设计的类型

析因实验

  • 设计析因实验
  • 分析重复的完全析因
  • 分析未重复的完全析因

筛选实验

  • 筛选重要效应
  • 了解部分析因设计
  • 定制筛选设计

响应曲面实验

  • 响应曲面设计的介绍
  • 分析响应曲面实验
  • 创建定制响应曲面设计
  • 序贯实验

实验设计指南

  • 实验设计指南的介绍
  • 定义问题和目标
  • 识别响应
  • 识别因子和因子水平
  • 识别限制和约束
  • 准备开展实验
  • 案例研究
预测性建模和文本挖掘

预测性建模的要点

  • 预测性建模的介绍
  • 过拟合与模型验证
  • 评估模型性能:预测模型
  • 评估模型性能:分类模型
  • 受试者操作特征 (ROC) 曲线

决策树

  • 决策树的介绍
  • 分类树
  • 回归树
  • 带验证的决策树
  • 随机 (Bootstrap) 森林

神经网络

  • 什么是神经网络?
  • 解释神经网络
  • 带神经网络的预测性建模

广义回归

  • 广义回归的介绍
  • 使用最大似然法拟合模型
  • 惩罚回归的介绍

模型比较和选择

  • 比较预测性模型

文本挖掘的介绍

  • 文本挖掘的介绍
  • 处理文本数据
  • 管理词条列表
  • 可视化和探索文本数据
  • 分析(挖掘)文本数据