Treemap

Qu'est-ce qu'un treemap ?

Un treemap montre la structure hiérarchique des données à l'aide de rectangles de différentes couleurs et tailles.

Comment utilise-t-on les treemaps ?

Les treemaps vous aident à voir la hiérarchie des données et les relations entre les variables.

Les treemaps montrent des données hiérarchisées

Un treemap est composé de rectangles montrant la structure hiérarchique de vos données. Les treemaps étaient à l'origine un moyen de montrer la structure et la taille des fichiers présents sur le disque dur d'un ordinateur. Aujourd'hui, on les utilise dans de nombreuses situations, y compris en l'absence de hiérarchie. Les treemaps permettent d'afficher une grande quantité de données dans un espace réduit.   

Les treemaps sont presque toujours générés par ordinateur. Les outils logiciels utilisent un algorithme pour créer des rectangles d'une taille proportionnelle au nombre d'observations correspondant à chaque rectangle. La plupart des outils permettent de colorer les rectangles et d'y ajouter des étiquettes. Certains permettent de zoomer pour afficher plus de détails, ce qui est utile lorsque le treemap contient de petits rectangles et que les étiquettes sont difficiles à lire.

Le treemap très simple de la figure 1 montre la structure du chiffre d'affaires de petites, moyennes et grandes entreprises. Les rectangles sont dimensionnés par chiffre d'affaires moyen (en USD) des catégories d'entreprise et colorés selon le profit par employé. 

Figure 1 : Treemap des tailles des entreprises et du profit par employé

Le graphique de la figure 1 montre le principe de base d'un treemap. Dans cet exemple, la couleur des rectangles vous permet de conclure que ce sont les entreprises de taille moyenne qui enregistrent le profit par employé le plus élevé, et la taille des rectangles que ce sont les grandes entreprises qui réalisent le chiffre d'affaires moyen le plus élevé. On peut toutefois utiliser les treemaps pour visualiser des données plus complexes. Les variables à la hiérarchie complexe sont de bons candidats pour une visualisation à l'aide d'un treemap. 

Exemples de treemaps

Exemple 1 : treemap de catégories et de hiérarchie

Développé à partir de l'exemple élémentaire, le treemap de la figure 2 montre deux catégories d'entreprises ainsi que la structure du chiffre d'affaires des petites, moyennes et grandes entreprises de chaque catégorie. Les rectangles du treemap sont dimensionnés par chiffre d'affaires moyen en USD pour la combinaison catégorie/taille. Quant à la couleur des rectangles, elle correspond au profit par employé. 

Figure 2 : Treemap avec deux catégories d'entreprises

Sur le treemap de la figure 2, nous voyons que ce sont les petits laboratoires pharmaceutiques qui enregistrent le profit par employé le plus élevé. D'après la taille des rectangles, nous voyons que ce sont les grandes entreprises des deux catégories qui réalisent le plus gros chiffre d'affaires. Nous constatons également que le profit par employé est négatif dans les sociétés informatiques de taille moyenne. Le treemap ne peut pas étiqueter le plus petit rectangle, correspondant aux petits laboratoires pharmaceutiques. Cela arrive souvent avec les grands ensembles de données qui génèrent de nombreux petits rectangles. Dans ce cas, les outils permettant un « survol de l'aide » ou un zoom avant interactif sont utiles. 

La conclusion initiale selon laquelle les grandes entreprises réalisent le chiffre d'affaires moyen le plus élevé reste vraie. Cependant, en utilisant la variable de catégorie, nous voyons que la conclusion initiale selon laquelle ce sont les entreprises de taille moyenne qui enregistrent le profit par employé le plus élevé n'est pas vraie.

Exemple 2 : catégories et hiérarchie pour les grands ensembles de variables dotés de nombreux niveaux

Les treemaps sont plus utiles pour les grands ensembles de variables comportant un grand nombre de niveaux. La figure 3 montre des données financières similaires à celles présentées sur la figure 2. Nous avons maintenant une variable pour différents types d'entreprises comportant six niveaux. Nous avons également une variable pour les tailles des entreprises. Cet exemple montre plus de catégories d'entreprises que les exemples précédents. Les rectangles sont dimensionnés par chiffre d'affaires moyen en USD. Les rectangles sont colorés par type d'entreprise et regroupés par taille d'entreprise.

Figure 3 : Treemap avec plusieurs variables et catégories

Ce treemap montre que ce sont les compagnies pétrolières qui enregistrent le chiffre d'affaires moyen le plus élevé à tous les niveaux de la hiérarchie des tailles des entreprises. Quant aux entreprises de boissons, elles enregistrent le chiffre d'affaires moyen le plus bas pour les grandes entreprises, mais pas pour les petites ou moyennes entreprises. Chez les petites entreprises, ce sont les savonneries qui ont le chiffre d'affaires moyen le plus bas et chez les entreprises de taille moyenne, les acteurs de l'aérospatiale.

Exemple 3 : treemap sans hiérarchie

Les treemaps peuvent également être utiles pour les données sans hiérarchie. Le treemap de la figure 4 montre le temps de sommeil total (en heures) de nombreuses espèces d'animaux. Les rectangles sont dimensionnés par durée de vie des espèces et colorés selon le nombre d'heures de sommeil.

Figure 4 : Treemap de données sans hiérarchie

D'après les couleurs du treemap de la figure 4, ce sont les chauves-souris qui ont le temps de sommeil total le plus long, et d'après la taille du rectangle, la petite chauve-souris brune vit plus longtemps que la grande chauve-souris brune. La taille des rectangles révèle que c'est l'homme qui vit le plus longtemps parmi toutes les espèces du treemap. 

Exemple 4 : catégorie sur l'axe Y

Les exemples précédents montrent les catégories, ou hiérarchies, sur l'axe X. L'exemple de la figure 5 montre la hiérarchie des catégories sur l'axe Y. Les données proviennent de voitures datant du milieu des années 1990 et les boîtes du treemap sont dimensionnées selon la consommation sur autoroute des modèles de voitures en miles par gallon (MPG). La variable de catégorie de l'axe Y indique si la voiture est fabriquée ou non aux États-Unis.

Figure 5 : Treemap avec catégories sur l'axe Y

Le treemap est utile pour voir la configuration générale. Par exemple, les rectangles orange sont-ils généralement plus grands que les rectangles bleus ? La Geo Metro est la voiture qui consomme le moins de toutes. Vous pourriez voir cela plus facilement avec le survol de l'aide, qui révèlerait le nombre de miles par gallon (MPG) pour chaque rectangle. Le logiciel a automatiquement classé les voitures par ordre alphabétique.

Exemple 5 : deux catégories 

Les treemaps sont utiles avec plusieurs catégories, lorsque ces dernières définissent la structure. Le treemap de la figure 6 montre les retards de six compagnies aériennes et les jours de la semaine comme variables de catégorie. La taille et la couleur des rectangles dépendent du retard moyen à l'arrivée.

Figure 6 : Treemap avec de nombreuses catégories

Pour toutes les compagnies aériennes, le retard moyen à l'arrivée varie selon les jours de la semaine. Si vous souhaitiez choisir la compagnie aérienne affichant le retard global le moins élevé, le treemap montre que vous devriez opter pour Southwest Airlines ou Delta Airlines. Pour ces deux compagnies, le retard moyen est inférieur à huit minutes en début de semaine et augmente le jeudi et le vendredi. Les deux compagnies affichent un retard moyen maximal inférieur à 11 minutes. En revanche, chez American Airlines, le retard moyen minimal est de 11 minutes. Parmi toutes les compagnies du treemap, c'est Southwest Airlines qui enregistre le retard moyen le moins important, le mardi. Le retard moyen le plus élevé revient à American Airlines, le vendredi.