산업 문제 해결을 위한 통계적 사고
무료 온라인 통계 과정
과정 개요
산업 문제 해결을 위한 통계적 사고 과정은 7개 모듈로 구성되며 약 30시간의 자율 학습으로 진행됩니다. 각 모듈은 짧은 강의 영상, JMP 데모, 질문 및 연습으로 구성됩니다. 모듈에서 다루는 주제는 아래와 같습니다.
모듈별 주제 살펴보기 (PDF 다운로드):
통계적 사고와 문제 해결
통계적 사고
- 통계적 사고란?
문제 해결
- 문제 해결 개요
- 통계적 문제 해결
- 문제 유형
문제 정의
- 문제 정의
- 목표 및 핵심 성과 지표
- 화이트 폴리머 사례 연구
공정 정의
- 공정이란?
- SIPOC 도해
- 입력/출력 공정 도해
- 상위하향식 흐름도
잠재적 근본 원인 파악
- 잠재적 원인 파악 도구
- 브레인스토밍
- 멀티 보팅
- 친화도 사용
- 특성 요인도
- 5 Why
- C&E 매트릭스
데이터 수집 및 정리
- 문제 해결을 위한 데이터 수집
- 데이터 유형
- 운영 정의
- 데이터 수집 계획
- 분석용 데이터 가져오기
탐색적 데이터 분석
데이터 설명
- 기술 통계 소개
- 데이터 유형
- 히스토그램
- 중심화 경향 및 위치 측도
- 산포 측도 — 범위 및 사분위 범위
- 산포 측도 — 분산 및 표준편차
- 연속형 데이터 시각화
- 범주형 데이터 설명
확률 개념
- 확률 개념 소개
- 표본 및 모집단
- 정규 분포의 이해
- 정규성 확인
- 중심 극한 정리
문제 해결을 위한 탐색적 데이터 분석
- 탐색적 데이터 분석 소개
- 연속형 데이터 탐색: 부가적 도구
- 파레토도
- 누적형 막대 차트 및 데이터 필터링
- 트리 맵 및 모자이크 그림
- 격자형 그림과 중첩 변수 사용
- 버블 그림과 히트맵
- 탐색적 데이터 분석 도구 요약
데이터 커뮤니케이션
- 데이터 커뮤니케이션 소개
- 효과적인 시각화 생성
- 시각화 유효성 평가
- 효과적인 시각화 설계
- 애니메이션을 활용한 시각적 커뮤니케이션
- 청중을 고려한 설계
- 대상 청중 이해
- 커뮤니케이션을 위한 시각화 설계
- 시각화 설계: 규칙
결과 저장 및 공유
- 결과 저장 및 공유 소개
- JMP 사용자와 결과 저장 및 공유
- JMP 비사용자와 결과 저장 및 공유
- 사용할 형식 결정
데이터 분석 준비
- 데이터 테이블 필수사항
- 일반적인 데이터 품질 문제
- 데이터 테이블의 문제 파악
- 문제 파악(한 번에 한 변수)
- 분석용 데이터 구조 변경
- 데이터 결합
- 새 변수 파생
- 날짜 작업
품질 관리
통계적 공정 관리
- 관리도 소개
- 개별값 및 이동 범위 관리도
- 우연원인 대 특수원인의 산포
- 특수원인 판정
- Xbar-R 관리도, Xbar-S 관리도
- 합리적 부분군
- 삼원 관리도
- 단계(Phase) 포함 관리도
공정 능력
- 고객 의견
- 공정 능력 지수
- 장단기 공정 능력 추정치
- 공정 개선을 위한 공정 능력 이해
- 공정 능력의 추정: 예제
- 비정규 데이터의 공정 능력 계산
- 여러 변수에 대한 공정 능력 추정
- 저성능 공정들의 파악
- 산업계의 관점
측정 시스템 연구
- MSA(측정 시스템 분석)란 무엇인가?
- 언어 및 용어
- 측정 시스템 연구 설계
- MSA 설계 및 수행
- MSA 분석
- 측정 시스템 정확도 연구
- 측정 공정 개선
데이터 기반 의사 결정
추정
- 통계적 추론 소개
- 신뢰 구간이란 무엇인가?
- 평균 추정
- 표본 추출 산포의 시각화
- 신뢰 구간 설정
- 신뢰 수준 및 제 1종 오류(Alpha Risk) 이해
- 예측 구간
- 공차 구간
- 구간 추정값의 비교
통계적 검정 기초
- 통계적 검정 소개
- 통계적 의사 결정
- 귀무 가설과 대립 가설의 이해
- 귀무 가설 하에서의 표본 분포
- p 값 및 통계적 유의성
연속형 데이터에 대한 가설 검정
- 단일 표본 t 검정 수행
- p 값 및 t 비율 이해
- 동등성 검정
- 두 평균의 비교
- 이분산 검정
- 대응 짝 관측값
- 일원 분산 분석(ANOVA)
- 다중 비교
- 통계적 유의성 대 실질적 유의성
표본 크기 및 검정력
- 표본 크기 및 검정력 소개
- 평균의 신뢰 구간에 대한 표본 크기
- 통계적 검정 결과
- 통계적 검정력
- 표본 크기 및 검정력 탐색
- 단일 표본 t 검정을 위한 표본 크기 계산
- 두 표본 t 검정 및 분산 분석을 위한 표본 크기 계산
상관관계와 회귀
상관
- 상관관계란 무엇인가?
- 상관관계 해석
단순 선형 회귀
- 회귀 분석 소개
- 단순 선형 회귀 모형
- 최소 제곱 방법
- 최소 제곱 방법의 시각화
- 회귀 모형의 가정
- 회귀 결과 해석
- 곡률 모형 적합
다중 선형 회귀
- 다중 선형 회귀란 무엇인가?
- 다중 선형 회귀 모형 적합
- 설명 예측 모형의 결과 해석
- 잔차 분석 및 이상치
- 범주형 예측 변수를 포함하는 다중 선형 회귀
- 교호작용을 포함하는 다중 선형 회귀
- 변수 선택
- 다중공선성
로지스틱 회귀 소개
- 로지스틱 회귀란 무엇인가?
- 단순 로지스틱 모형
- 단순 로지스틱 회귀 예제
- 로지스틱 회귀 결과 해석
- 다중 로지스틱 회귀
- 교호작용을 포함하는 로지스틱 회귀
- 일반적 문제들
실험계획법(DOE)
실험계획법(DOE) 소개
- 실험계획법(DOE)이란 무엇인가?
- 임시적 실험 및 OFAT(One-Factor-at-a-Time, 한 번에 한 요인) 실험 수행
- 왜 실험계획법(DOE)을 사용하는가?
- 실험계획법(DOE) 용어
- 실험 설계 유형
요인 실험
- 요인 실험 설계
- 반복 완전 요인의 분석
- 반복 불가능 완전 요인의 분석
선별 설계
- 중요 효과 선별
- 부분 요인 설계 개관
- 사용자 정의 선별 설계
반응 표면 실험
- 반응 표면 설계 소개
- 반응 표면 실험 분석
- 사용자 정의 반응 표면 설계 생성
- 순차 실험
실험계획법(DOE) 지침
- 실험계획법(DOE) 지침 소개
- 문제 및 목적의 정의
- 반응의 파악
- 요인 및 요인 수준 파악
- 제한 및 제약 조건 파악
- 실험 실시 준비
- 사례 연구
예측 모델링 및 텍스트 마이닝
예측 모형의 필수사항
- 예측 모형 소개
- 과대적합 및 모형 검증
- 모형 성능 평가: 예측 모형
- 모형 성능 평가: 분류 모형
- ROC(Receiver Operating Characteristic) 곡선
결정 트리
- 결정 트리(Decision Trees) 소개
- 분류 트리
- 회귀 트리
- 결정 트리의 검증
- 랜덤(붓스트랩) 포레스트
신경망 네트워크
- 신경망이란 무엇인가?
- 신경망 해석
- 신경망을 이용한 예측 모형
일반화 회귀
- 일반화 회귀 소개
- 최대 우도를 사용한 모형 적합
- 벌점 회귀 방법 소개
모형 비교 및 선택
- 예측 모형 비교
텍스트 마이닝 소개
- 텍스트 마이닝 소개
- 텍스트 데이터 처리
- 용어 목록 구성
- 텍스트 데이터 시각화 및 탐색
- 텍스트 데이터 분석(마이닝)