解决行业问题的统计思维

免费的在线统计学课程

返回课程概览

课程纲要

《解决行业问题的统计思维》课程由七个模块组成，共计约 30 小时的自行掌控进度的学习。每个模块都包括教学短视频、JMP 演示、问题和练习。每个模块所涵盖的主题如下所述。

按模块来探索主题（或下载 PDF 版本）：

统计思维与问题解决

统计思维

什么是统计思维

问题解决

问题解决的概览
解决问题的统计方法
问题类型

定义问题

定义问题
目标与关键绩效指标
白色聚合物案例研究

定义过程

什么是过程？
制定 SIPOC 图
制定输入/输出过程图
自上而下流程图和部署流程图

识别潜在的根本原因

识别潜在原因的工具
头脑风暴
多轮投票
使用亲和图
因果图
五个为什么
因果矩阵

编制和收集数据

用于解决问题的数据收集
数据类型
可操作的定义
数据收集的策略
导入数据进行分析

探索性数据分析

描述数据

描述性统计量的介绍
数据类型
直方图
集中趋势和位置的测量
离差的测量 — 极差和四分位数间距
离差的测量 — 方差和标准差
可视化连续型数据
描述类别型数据

概率概念

概率概念的介绍
样本和总体
了解正态分布
检验正态性
中心极限定理

用于解决问题的探索性数据分析

探索性数据分析的介绍
探索连续型数据：增强工具
Pareto 图
堆叠条形图和数据过滤
树状图和马赛克图
使用格状图和叠加变量
气泡图和热图
探索性数据分析工具的汇总

与数据沟通

与数据沟通的介绍
创建有效可视化
评估可视化的有效性
设计有效可视化
用动画进行可视化沟通
针对受众进行设计
了解目标受众
设计用于沟通的可视化
设计可视化：注意事项

保存和分享结果

保存和分享结果介绍
JMP 内部的保存和分享结果
JMP 外部的保存和分享结果
决定使用何种格式

准备数据进行分析

数据表要点
常见数据质量问题
识别数据表中的问题
识别问题（单次单变量）
重构数据进行分析
合并数据
衍生新变量
处理日期

质量方法

统计过程控制

控制图的介绍
单值和移动极差控制图
常见原因变异与特殊原因变异
特殊原因的检验
均值-极差控制图与均值-标准差控制图
合理子组化
三因子控制图
分阶段的控制图

过程能力

客户的声音
过程能力指标
能力的短期和长期估计
了解过程改进的能力
估计过程能力：示例
计算非正态数据的能力
估计多个变量的过程能力
识别性能差的过程
行业视角

测量系统研究

什么是测量系统分析 (MSA)？
语言和术语
设计测量系统研究
设计和执行 MSA
分析 MSA
研究测量系统准确度
改进测量过程

利用数据做出决策

估计

统计推断的介绍
什么是置信区间？
估计平均值
可视化抽样变异
构建置信区间
了解置信水平和 Alpha 风险
预测区间
容差区间
比较区间估计

统计检验的基础

统计检验的介绍
统计决策
了解原假设和备择假设
原假设下的抽样分布
p 值和统计显著性

连续型数据的假设检验

执行单样本 t 检验
了解 p 值和 t 比值
等价性检验
比较两个平均值
不等方差检验
成对观测
单因子 ANOVA（方差分析）
多重比较
统计显著性与实际显著性

样本大小与功效

样本大小与功效的介绍
均值置信区间的样本大小
统计检验的结果
统计功效
探索样本大小与功效
计算单样本 t 检验的样本大小
计算双样本 t 检验和方差分析的样本大小

相关性与回归

相关性

什么是相关性？
解释相关性

简单线性回归

回归分析的介绍
简单线性回归模型
最小二乘法
可视化最小二乘法
回归模型的假定
解释回归结果
使用曲率拟合模型

多元线性回归

什么是多元线性回归？
拟合多元线性回归模型
解释解释建模中的结果
残差分析和离群值
带类别型预测变量的多元线性回归
带交互项的多元线性回归
变量选择
多重共线性

Logistic 回归的介绍

什么是 Logistic 回归？
简单 Logistic 模型
简单 Logistic 回归示例
解释 Logistic 回归结果
多元 Logistic 回归
带交互项的 Logistic 回归
常见问题

实验设计

实验设计的介绍

什么是实验设计？
开展特设实验和单次单因子 (OFAT) 实验
为什么使用实验设计？
实验设计的术语
实验设计的类型

析因实验

设计析因实验
分析重复的完全析因
分析未重复的完全析因

筛选实验

筛选重要效应
了解部分析因设计
定制筛选设计

响应曲面实验

响应曲面设计的介绍
分析响应曲面实验
创建定制响应曲面设计
序贯实验

实验设计指南

实验设计指南的介绍
定义问题和目标
识别响应
识别因子和因子水平
识别限制和约束
准备开展实验
案例研究

预测性建模和文本挖掘

预测性建模的要点

预测性建模的介绍
过拟合与模型验证
评估模型性能：预测模型
评估模型性能：分类模型
受试者操作特征 (ROC) 曲线

决策树

决策树的介绍
分类树
回归树
带验证的决策树
随机 (Bootstrap) 森林

神经网络

什么是神经网络？
解释神经网络
带神经网络的预测性建模

广义回归

广义回归的介绍
使用最大似然法拟合模型
惩罚回归的介绍

模型比较和选择

比较预测性模型

文本挖掘的介绍

文本挖掘的介绍
处理文本数据
管理词条列表
可视化和探索文本数据
分析（挖掘）文本数据