饼图
饼图显示部分与整体的关系
饼图是分成多个区域或切片的圆形。每个切片代表变量的一个水平的观测值计数或百分比。商务工作中经常会使用饼图。例如,显示客户类型百分比,不同产品带来的收入百分比,以及不同国家/地区产生的利润。有少量水平时,饼图有助于显示部分与整体的关系。例如,一个的饼图可以显示不同品牌产品线占收入的比例,如图 1 中所示。
图 1 中的饼图显示,几乎一半的收入来自 Salon 产品线,其收入所占百分比大于其他产品线。Budget 产品线占收入的百分比最小。我们可以使用饼图来关注部分与整体的关系。
饼图最适合用作基本的二维展示,如上所示。使用三维饼图常常会让人困惑,所以建议不要这么做。3D 区域不会进一步增加关于数据的任何信息,而是增加了另一个图表功能,以便能直观地解读图表。
饼图示例
示例 1:基本饼图
图 2 显示了代表泰坦尼克号上旅客舱位的饼图。目的是要显示,超过一半的旅客持的是三等舱船票(最便宜)。持有头等舱和二等舱船票的其他旅客,人数几乎相等。饼图的目的不是关注特定的百分比,而是关注部分与整体的关系。
示例 2:条形图显示相似的值
当表示部分与整体关系的值很相似时,饼图则不是最佳选择。请查看图 2 中关于泰坦尼克号的饼图。当目的是显示“几乎一半”的旅客在头等舱或二等舱里时,饼图是有帮助的。当目的是显示更多详细信息时,条形图更容易直观地解读。图 3展示了同样的数据在条形图中的情况。
在图 3 中,我们很容易看到,二等舱中的旅客比头等舱中的旅客少,因为我们的眼睛更善于比较条形图中的长度,而不是饼图中的角度和面积。
示例 3:使用条形图来显示多个水平
当我们希望显示具有多个水平的变量的部分与整体关系时,饼图往往不是最佳选择。图 4 中的饼图显示了各种电影类型部分与整体关系,但这种数据可视化结果难以解读。
在含有那么多分区的饼图中,很难解读部分与整体的关系。而且,与图 2一样,当类别大小相似时,很难区分它们之间的差异。比如,是恐怖电影更多还是动画电影更多?这很难从饼图中确定。
图 5 是同样的电影数据的条形图。
对于类型较多时,条形图比饼图可以更好地显示部分与整体的关系。可以看到,恐怖电影比动画电影多。还可以通过向条形添加标签或者将条形按百分比(而不是按字母顺序)排序来进一步优化条形图。在图 6 中,经过排序的条形图很容易说明部分与整体的关系,以及恐怖电影比动画电影多这个事实。
示例 4:使用多个饼图来显示部分与整体关系的变化
当分析的目的是显示部分与整体关系的变化时,特别是,当你不是关注特定的详细信息时,这时,多个饼图将非常有用。图 7 显示了关于智能手机的历史数据,从 2006 年发布第 1 部智能手机开始。每个饼图按照特定年份的操作系统显示了市场份额的部分与整体关系。
我们可以看到, Windows 操作系统如何最初在 2006 年以一半的市场份额脱颖而出,但最后在 2011 年市场份额显著缩小。同样,我们可以看到,Android 操作系统直到 2008 年才进入市场,但是到 2011 年已占有一半以上的市场份额。这里的分析目的是显示随时间推移而不断变化的部分与总体的关系。如果目标是显示每个操作系统随时间推移的变化,线图则是更好的选择。
饼图和数据类型
分类型或名义型数据:适合使用饼图
饼图可用于显示分类型或名义型数据的部分与整体的关系。饼图中的切片通常代表占总体的百分比。
对于分类型数据,样本常常分成多个组,并且响应已有定义好的顺序。例如,在一项调查中,要求您从“强烈不同意”到“强烈同意”这样的区间来提供意见,您的响应就是分类型的。
对于名义型数据,样本也分成多个组,但没有任何特定的顺序。例如,居住的国家/地区就是名义型变量。您可以使用国家/地区缩写,也可以使用数字对国家/地区名称编码。无论采用哪一种方式,您都只是在为不同的数据组命名而已。
连续型数据:选择另一种图表类型
通常,饼图对连续型数据不适合。因为连续型数据是在具有许多可能值的尺度上进行衡量的,显示部分与整体的关系没有意义。以下是连续型数据的一些示例:
- 年龄
- 血压
- 体重
- 温度
- 速度