탐색적 데이터 분석 개요 (0:47)
산업 문제 해결을 위한 통계적 사고
무료 온라인 통계 과정
탐색적 데이터 분석
탐색적 데이터 분석(EDA)은 요약 통계와 그래픽 도구를 사용하여 데이터와 데이터의 의미를 이해하는 조사 방법입니다.
EDA를 통해 데이터의 패턴을 파악하고 잠재적인 변수 간 관계를 이해할 수 있으며 이상치 또는 비정상적인 관측치와 같은 예외적 현상(anomalies)을 발견할 수 있습니다. 이 과정은 보다 정형화된 통계 방법을 사용하여 검정할 수 있는 흥미로운 질문이나 가설을 만들어내는 데 그 목적이 있습니다.
이 모듈에서 다루는 특정 주제는 다음과 같습니다.
데이터 설명
- 기술 통계량 소개
- 데이터 유형
- 히스토그램
- 중심화 경향 및 위치 측정
- 스프레드 측정 - 범위 및 사분위수 범위
- 스프레드 측정 - 분산 및 표준편차
- 연속형 데이터 시각화
- 범주형 데이터 설명
확률 개념
- 확률 개념 소개
- 표본 및 모집단
- 정규 분포 이해
- 정규성 확인
- 중심 극한 정리
문제 해결을 위한 탐색적 데이터 분석
- 탐색적 데이터 분석 소개
- 연속형 데이터 탐색: 확장 도구
- 파레토도
- 팩형 막대 차트 및 데이터 필터링
- 트리 맵 및 모자이크 그림
- 트렐리스 그림과 중첩 변수 사용
- 버블 그림과 히트맵
- 탐색적 데이터 분석 도구 요약
데이터 커뮤니케이션
- 데이터 커뮤니케이션 소개
- 효과적인 시각화 생성
- 시각화 유효성 평가
- 효과적인 시각화 설계
- 애니메이션을 활용한 시각적 커뮤니케이션
- 대상을 고려한 설계
- 목표 대상 이해
- 커뮤니케이션을 위한 시각화 설계
- 시각화 설계: 규칙
결과 저장 및 공유
- 결과 저장 및 공유 소개
- JMP 내부에서 결과 저장 및 공유
- JMP 외부에서 결과 저장 및 공유
- 사용할 형식 결정
데이터 분석 준비
- 데이터 테이블 필수사항
- 일반적인 데이터 품질 문제
- 데이터 테이블의 문제 식별
- 문제 식별(한 번에 한 변수)
- 분석용 데이터 구조 변경
- 데이터 결합
- 새 변수 파생
- 날짜 작업