円グラフ
部分と全体の関係を示す円グラフ
円グラフでは、円が領域または扇形に分割されています。各扇形は、変数の各水準の観測度数または割合を表します。円グラフはビジネスでよく使用されます。その使用例としては、顧客の種類の割合、さまざまな製品からの収益の割合、およびさまざまな国からの利益の表示が含まれます。円グラフは、水準数が少ない場合に、部分と全体の関係を示すのに役立ちます。例えば、図1に示すように、円グラフを上手に使って、さまざまなブランドの製品ラインが収益にどのように貢献しているかを示せるかもしれません。
図1の円グラフは、収益のほぼ半分がサロン(Salon)の製品ラインからのものであり、他の製品ラインからの収益の割合よりも大きいことを示しています。低価格帯(Budget)の製品ラインは、最小の収益の割合を占めます。このように、円グラフを使用して、部分と全体の関係に焦点を当てます。
上に示したように、基本的な2次元グラフの例として円グラフは最もよく使用されます。混乱が生じることが多いため、3次元の円グラフの使用は推奨されません。3次元の領域はデータに関する情報ではなく、別の視覚的な特徴をグラフに追加します。
円グラフの例
例1:基本的な円グラフ
図2は、タイタニック号の乗客の等級の円グラフを示しています。目標は、乗客の半数以上が3等客室のチケット(最も安価)を持っていたことを示すことです。他の乗客は、1等客室と2等客室にほぼ均等に分割されます。目標は、特定の割合ではなく、部分と全体の関係に焦点を当てることです。
例2:棒グラフは類似の値をはっきりさせます
部分と全体の関係の値が非常に類似している場合、円グラフは最良の選択ではありません。図2のタイタニック号の円グラフを見てください。乗客の「ほぼ半分」が一等客室または二等客室のいずれかにいることを示すことが目標である場合、円グラフは有用です。目標がより詳細を示すことである場合、棒グラフの方が視覚的な解釈が容易になります。図3のグラフは、同じデータを棒グラフにプロットしたものです。
円グラフの角度や面積よりも棒グラフの長さを比較する方が目視性に優れています。そのため、図3では2等客室の乗客が1等客室の乗客よりも少ないことが簡単にわかります。
例3:水準が多い場合は棒グラフを使用します
多くの水準を持つ変数の部分と全体の関係を示したいとき、多くの場合で円グラフは最良の選択ではありません。図4の円グラフは、多くのカテゴリの映画について、部分と全体の関係を示していますが、このデータの視覚化方法では、解釈が困難です。
分割が非常に多い円グラフでは、部分と全体の関係の詳細を検討するのは困難です。また、図2のように、同じくらいのサイズのカテゴリ間の差を区別することは困難です。例えば、スリラー映画とアニメーション映画のどちらが多いでしょうか? この場合、円グラフから判断するのは困難です。
図5は、同じデータの棒グラフです。
棒グラフは、円グラフよりも多くのジャンルの部分と全体の関係を示すのに適しています。また、アニメーション映画よりもスリラー映画の方が多いことがわかります。棒にラベルを追加するか、アルファベット順ではなく割合の順にバーを並べ替えることで、この棒グラフをさらに改善できます。図6では、並べ替えられた棒グラフによって、部分と全体の関係と、アニメーション映画よりもスリラー映画が多いという事実が明確に示されています。
例4:複数の円グラフを使用して、部分と全体の関係の変化を示す
複数の円グラフは、部分と全体の関係の変化を示すことが目標である場合、特に具体的な詳細に焦点を当てることが目標ではない場合に役立ちます。図7は、スマートフォンの履歴データを示していて、2006年に最初のスマートフォンが発売されたときから始まります。各円グラフは、特定の年のオペレーティングシステムの市場シェアの部分と全体の関係を示しています。
Windowsオペレーティングシステムが、2006年に半分の市場シェアから始まり、2011年にはるかに小さい市場シェアで終わったことがわかります。同様に、Androidオペレーティングシステムは2008年まで市場に出ておらず、2011年までに市場の半分以上を占めていたことがわかります。ここでの目標は、時間の経過とともに変化する部分と全体の関係を示すことです。各オペレーティングシステムの経時変化を示すことが目標である場合、折れ線グラフがより適切な選択です。
円グラフとデータの種類
カテゴリカルデータまたは名義尺度データ:円グラフに適しています
円グラフは、カテゴリカルデータまたは名義尺度データの部分と全体の関係を示すのに適しています。円グラフの扇形は、全体に対する割合を表します。
カテゴリカルデータでは、標本はグループに分割されることが多く、応答の順序が定義されている場合があります。例えば、「まったくそう思わない」から「非常にそう思う」までのスケールで意見を求められるアンケートでは、回答はカテゴリカルです。
名義尺度データでも、標本はグループに分割されますが、特定の順序はありません。居住国は名義尺度変数の一例です。国の略語を使用したり、数字を使用して国名をコーディングしたりできます。いずれにせよ、データのさまざまなグループに名前を付けるだけです。
連続尺度データ:別のグラフタイプを選択してください
通常、円グラフは、連続変数データには適していません。連続変数データは、多くの可能な値を取り得るスケールで測定されるため、部分と全体の関係を示すことは意味がありません。連続尺度データの例には次のようなものがあります。
- 経過時間
- 血圧
- 重み
- 温度
- 速度