산점도 및 기타 그래프는 변수 간의 관계를 시각화하는 데 도움이 됩니다. 관계를 시각화한 후에는 다음 단계로 그 관계를 분석하여 수치로 설명할 수 있습니다. 변수 간의 관계를 수치로 정의한 것을 모형이라고 합니다. 더욱 중요한 것은 모형에서 한 변수(Y)의 평균값을 다른 변수(X)의 값을 바탕으로 예측할 수도 있다는 것입니다. X 변수를 예측 변수라고도 합니다. 일반적으로 이러한 모형을 회귀 모형이라고 합니다.
JMP의 단순 모형 적합 플랫폼과 다중 모형 적합 플랫폼에서 회귀 모형을 만듭니다.
관계 유형에서는 네 가지 주요 유형의 관계를 보여 줍니다.
로지스틱 회귀는 심화 주제입니다. Basic Analysis 설명서의 Logistic Analysis 장을 참조하십시오.
먼저, 직원 수와 매출 수익 간의 관계를 확인하기 위해 산점도를 생성합니다. 이 산점도는 “데이터 시각화”章中第  “산점도 생성”에서 작성되었습니다. 이상치 하나(직원 수와 매출이 현저하게 높은 회사)를 숨기고 제외한 후 Sales ($M)# Employ 산점도의 산점도는 결과를 보여 줍니다.
Sales ($M)# Employ 산점도
직원 수로 매출 수익을 예측하려면 회귀 모형을 적합시켜야 합니다. 이변량 적합의 빨간색 삼각형에서 선형 적합을 선택합니다. 회귀선이 산점도에 추가되고 보고서가 보고서 창에 추가됩니다.
회귀선
이 예에서 R² 값은 크기 때문에 직원 수를 기반으로 한 예측 모형이 매출 수익을 예측할 수 있음을 분명하게 보여 줍니다. R² 값은 변수 간의 관계 강도를 나타내며 상관관계라고도 합니다. 상관관계가 0이라는 것은 변수 사이에 관계가 없음을 나타내며 상관관계 1은 완벽한 선형 관계를 나타냅니다.
2.
> 제외하기/제외하기 취소를 선택합니다.
3.
이변량 적합의 빨간색 삼각형 메뉴에서 선형 적합을 선택하여 이 모형을 적합화합니다.
모형 비교
모형 비교의 결과를 바탕으로 데이터 분석가는 다음과 같은 결론을 내릴 수 있습니다.
이 질문에 답하려면Type을 기준으로 Profits ($M)을 적합시킵니다.
1.
도움말 > 표본 데이터 라이브러리를 선택하고 Companies.jmp를 엽니다.
2.
Companies.jmp 표본 데이터 테이블을 열어 둔 상태라면 제외되었거나 숨겨진 행이 있을 수 있습니다. 행을 기본 상태로 되돌려 모든 행을 포함하고 행을 숨기지 않으려면 > 행 상태 지우기를 선택합니다.
3.
분석 > 단순 모형 적합을 선택합니다.
4.
Profits ($M)을 선택하고 Y, 반응을 클릭합니다.
5.
Type을 선택하고 X, 요인을 클릭합니다.
6.
확인을 클릭합니다.
회사 유형별 이익
2.
> 제외하기/제외하기 취소를 선택합니다. 해당 데이터 점이 더 이상 계산에 포함되지 않습니다.
3.
> 숨기기/숨기기 취소를 선택합니다. 해당 데이터 점이 모든 그래프에서 숨겨집니다.
4.
이상치 없이 산점도를 다시 작성하려면 일원 분석의 빨간색 삼각형 메뉴에서 다시 실행 > 분석 다시 실행을 선택합니다. 원래의 산점도 창은 닫을 수 있습니다.
업데이트된 산점도
표시 옵션 > 평균 선. 이 옵션을 선택하면 산점도에 평균선이 추가됩니다.
평균과 표준 편차. 이 옵션을 선택하면 평균 및 표준편차를 제공하는 보고서가 표시됩니다.
평균선 및 보고서
t 검정 결과
신뢰 구간 한계를 사용하여 두 회사 유형의 이익에 얼마나 많은 차이가 있는지 파악합니다. t 검정 결과에서 신뢰 구간 상한 차이신뢰 구간 하한 차이를 살펴봅니다. 재무 분석가는 제약 회사의 평균 이익이 컴퓨터 회사의 평균 이익보다 높은 3억 4천 3백만 달러에서 9억 2천 6백만 달러 사이라고 결론을 내립니다.
범주형 X 변수와 Y 변수를 사용할 때는 Y 변수 내 수준의 비율을 X 변수 내의 수준과 비교할 수 있습니다.
이 예에서는 계속 Companies.jmp 데이터 테이블을 사용합니다. 第 “한 변수에 대한 평균 비교”에서 재무 분석가는 제약 회사가 컴퓨터 회사보다 평균적으로 더 높은 이익을 얻는 것으로 판단했습니다.
1.
도움말 > 표본 데이터 라이브러리를 선택하고 Companies.jmp를 엽니다.
2.
이전 예의 Companies.jmp 데이터 파일을 계속 열어 둔 상태라면 제외되거나 숨겨진 행이 있을 수 있습니다. 행을 기본 상태로 되돌려 모든 행을 포함하고 행을 숨기지 않으려면 > 행 상태 지우기를 선택합니다.
3.
분석 > 단순 모형 적합을 선택합니다.
4.
Size Co를 선택하고 Y, 반응을 클릭합니다.
5.
Type을 선택하고 X, 요인을 클릭합니다.
6.
확인을 클릭합니다.
회사 유형별 회사 규모
분할표에는 이 예에 적용할 수 없는 정보가 포함되어 있습니다. 분할표의 빨간색 삼각형 메뉴에서 총 %열 %를 선택 취소하여 해당 정보를 제거합니다. 업데이트된 분할표에서는 업데이트된 테이블을 보여 줍니다.
업데이트된 분할표
이 질문에 답하려면 검정 보고서에서 Pearson 검정의 p-value를 사용해야 합니다. 회사 유형별 회사 규모를 참조하십시오. P-value 0.011이 유의 수준 0.05보다 작기 때문에 재무 분석가는 다음과 같이 결론을 내립니다.
第 “한 변수에 대한 평균 비교” 섹션에서는 범주형 변수의 수준에서 평균을 비교했습니다. 한 번에 두 개 이상의 변수 수준에서 평균을 비교하려면 분산 분석 기법 또는 ANOVA를 사용해야 합니다.
유형(제약 또는 컴퓨터)
크기(소규모, 중간 규모, 대규모)
1.
도움말 > 표본 데이터 라이브러리를 선택하고 Companies.jmp를 엽니다.
2.
그래프 > 그래프 빌더를 선택합니다. 그래프 빌더 창이 나타납니다.
3.
Profits ($M)을 클릭하고 Y 영역으로 끌어서 놓습니다.
4.
Size Co를 클릭하고 X 영역으로 끌어서 놓습니다.
5.
Type을 클릭하고 그룹 X 영역으로 끌어서 놓습니다.
회사 이익 그래프
6.
이 이상치를 선택한 후 마우스 오른쪽 버튼을 클릭하고 행 > 행 제외를 선택합니다. 해당 점이 제거되고 그래프 범위가 자동으로 업데이트됩니다.
이상치가 제거된 그래프
1.
이상치 데이터 점이 제거된 Companies.jmp 표본 데이터로 돌아갑니다. 第 “관계 탐지”를 참조하십시오.
2.
분석 > 다중 모형 적합을 선택합니다.
3.
Profits ($M)을 선택하고 Y를 클릭합니다.
4.
TypeSize Co를 모두 선택합니다.
5.
매크로 버튼을 클릭하고 완전 요인을 선택합니다.
6.
강조 메뉴에서 효과 선별을 선택합니다.
7.
대화상자를 열린 상태로 유지 옵션을 선택합니다.
완료된 다중 모형 적합 창
8.
실행을 클릭합니다. 보고서 창에 모형 결과가 나타납니다.
참고: 모든 다중 모형 적합 결과에 대한 자세한 내용은 Fitting Linear Models 설명서의 Model Specification 장을 참조하십시오.
효과 검정 보고서(효과 검정 보고서 참조)는 통계 검정 결과를 보여 줍니다. 다중 모형 적합 창에는 모형에 포함된 유형, 회사 규모 및 유형*회사 규모 효과에 대한 검정이 있습니다.
효과 검정 보고서
먼저, 모형에서의 상호 작용에 대한 검정인 유형*회사 규모 효과를 살펴봅니다. 이상치가 제거된 그래프에서는 제약 회사의 규모에 따라 이익이 다르게 나타난다는 것을 보여 주었습니다. 그러나 이 효과 검정은 이익과 관련하여 유형과 규모 간에 상호 작용이 없음을 나타냅니다. P-value 0.218은 크고 유의 수준 0.05보다 큽니다. 따라서 해당 효과를 모형에서 제거하고 모형을 다시 실행합니다.
2.
모형 효과 생성 상자에서 Type*Size Co 효과를 선택하고 제거를 클릭합니다.
3.
실행을 클릭합니다.
업데이트된 효과 검정 보고서
第 “하나의 예측 변수가 있는 회귀 사용” 섹션에서는 하나의 예측 변수와 하나의 반응 변수로 구성된 단순 회귀 모형을 작성하는 방법을 소개했습니다. 다중 회귀는 둘 이상의 예측 변수를 사용하여 평균 반응 변수를 예측합니다.
이 예에서는 초코바의 영양 정보가 포함된 Candy Bars.jmp 데이터 테이블을 사용합니다.
다중 회귀를 사용하여 이 세 가지 예측 변수를 통해 평균 반응 변수를 예측합니다.
1.
도움말 > 표본 데이터 라이브러리를 선택하고 Candy Bars.jmp를 엽니다.
2.
그래프 > 산점도 행렬을 선택합니다.
3.
Calories를 선택하고 Y, 열을 클릭합니다.
4.
Total fat g, Carbohydrate gProtein g를 선택하고 X를 클릭합니다.
5.
확인을 클릭합니다.
산점도 행렬 결과
Candy Bars.jmp 표본 데이터 테이블을 계속 사용합니다.
1.
분석 > 다중 모형을 선택합니다.
2.
Calories를 선택하고 Y를 클릭합니다.
3.
Total fat g, Carbohydrate gProtein g를 선택하고 추가를 클릭합니다.
4.
강조 옆에서 효과 선별을 선택합니다.
다중 모형 적합 창
5.
실행을 클릭합니다.
참고: 모든 모형 결과에 대한 자세한 내용은 Fitting Linear Models 설명서의 Model Specification 장을 참조하십시오.
실제값 대 예측값 도표는 실제 칼로리와 예측된 칼로리를 보여 줍니다. 예측값이 실제값에 더 가까워지면 산점도의 점은 빨간색 선으로 더 몰려듭니다. 실제값 대 예측값 도표을 참조하십시오. 점이 모두 선에 매우 가깝기 때문에 모형이 선택한 요소를 기반으로 칼로리를 정확하게 예측한다는 것을 알 수 있습니다.
실제값 대 예측값 도표
모형 정확도의 또 다른 척도는 R² 값입니다. 이 값은 실제값 대 예측값 도표의 도표 아래에 나타납니다. R² 값은 모형에 의해 설명된 대로 칼로리의 변동률을 측정합니다. 1에 가까운 값은 모형이 정확하게 예측한다는 것을 의미합니다. 이 예에서 R² 값은 0.99입니다.
모수 추정값 보고서
예측 프로파일러
Milky Way의 요인 값
참고: 예측 프로파일러에 대한 자세한 내용은 Profilers 설명서의 Profiler 장을 참조하십시오.