基本绘图 > 图形生成器示例 > 散点图示例
发布日期: 09/18/2023

散点图示例

数据

本例使用来自 442 位糖尿病患者的数据。这些数据包括基准临床和实验室数据,以及每位患者在初次访视一年后得到的糖尿病疾病进展的二元测度。该测度将疾病进展归为“低”或“高”两类。

方法

本例使用两个具有共享的 X 轴、轴定制设置和注解的散点图。

目标

本例的目标是比较和理解两种分类模型对较“高”程度疾病进展的预测概率。

运行分类模型

您需要构建一个分类模型,用来根据临床和实验室变量预测疾病进展。您将构建两个不同的分类模型、保存预测公式,并比较它们的预测分类。

1. 选择帮助 > 样本数据文件夹,然后打开 Diabetes.jmp

2. 点击 Y 二值型的决策树脚本旁边的绿色小三角以生成决策树预测模型。

3. 点击“‘Y 二值型’分割”旁边的红色小三角,然后选择保存列 > 保存预测公式。您可以关闭该窗口。

这会将概率公式保存至数据表。

4. 在数据表中,右击 Prob(Y 二值型= = High) 列并选择列信息

5. 将列名改为分割:概率“High”并点击确定

6. 点击 Y 二值型的神经脚本旁边的绿色小三角以生成神经网络预测模型。

7. 点击“模型 NTanH(3)”红色小三角并选择保存刻画公式。您可以关闭该窗口。

这会将概率公式保存至数据表。

8. 在数据表中,右击概率(Y 二值型=High) 列并选择列信息

9. 将列名改为神经:概率“High”并点击确定

创建初始图形

您将比较模型预测的患者疾病进展程度高的概率。

1. 选择图形 > 图形生成器

2. 选择分割:概率“High”并将其拖至 X 区域。

3. 选择神经:概率“High”,并将其拖至 X 区域中分割:概率“High”的右侧。这将创建另一个 X 轴。

图 4.18 将“神经:概率‘High’”拖至“分割:概率‘High’”的右侧 

Drag Neural Prob High to the Right of Partition Prob High

4. 选择 Y 二值型并将它拖至“叠加”区域。

5. 点击“图形生成器”红色小三角并选择图形间距

6. 在“图形间距”旁边键入 6 并点击确定

这会增加两个 X 轴之间的间距。

图 4.19 初始模型概率图形 

Initial Graph of Model Probabilities

定制图形

在两个建模平台中,默认阈值为 0.50。这意味着,若患者的预测概率比“High”高 0.50,则模型将其分类预测为“High”。使用参考线在图中显示阈值。

1. 右击分割:概率“High”X 轴并选择轴设置

2. 在“尺度”部分中,点击倒序旁边的框。

3. 在“刻度/箱增量”部分中,将副刻度数设置为 2。

4. 在“参考线”部分中,在标签旁边的框中键入 0.50。

5. 在“线条样式”旁边的框中,输入 3。3 指示参考线的粗细。

6. 点击添加

图 4.20 X 轴设置 

X Axis Settings

7. 点击确定

8. 右击“分割:概率‘High’”X 轴并选择编辑 > 复制轴设置。右击“神经:概率‘High’”X 轴并选择编辑 > 粘贴轴设置

9. 点击完成

为图形添加注解

1. 在主菜单中,点击工具 > 线条。在“分割:概率‘High’”图形中的参考线左侧绘制一条水平线。

图 4.21 绘制在“分割:概率‘High’”参考线左侧的水平线 

Line Drawn to the Left of the Partition Prob High Reference Line

2. 右击这条线并选择箭头指向

箭头应指向远离参考线的方向。

3. 在主菜单中,点击工具 > 注解,然后在图形中的箭头上方点击。

4. 在文本框中键入归类为“High”。请参见图 4.22

5. 在“神经:概率‘High’”图形中重复第 1 步第 4 步

图 4.22 预测概率的分布 

Distribution of Predicted Probabilities

图中显示两个模型的预测概率分布不同。分割模型有五个预测得分水平,而神经模型得分分散在整个得分范围内。对于这两个模型,在每个图的最右侧都聚集了一组蓝色数据点。这是两个模型都能正确分类的较低程度测试对象,因为它们落在阈值的右侧。

需要更多信息?有问题?从 JMP 用户社区得到解答 (community.jmp.com).