L'importance de la visualisation des données

Image de synthèse : l’importance de la visualisation des données AdobeStock_207639618 @ Tartila – Adobe.Stock
Image de synthèse : l’importance de la visualisation des données

Publié le: 27.02.2023
Auteur: Alex Lavrynets

La visualisation des données est indispensable dans tout processus en science des données. Elle contribue à faciliter la compréhension des données dans leur ensemble et rend le processus de leur analyse plus intuitif pour les professionnels, les chercheurs et le grand public.

La visualisation de données consiste à représenter les données sous forme graphique (p.ex. générer une courbe à partir des nombres contenus dans un tableau). Lorsqu’il s’agit d’analyser les données complexes en quantités massives, la visualisation devient un outil de communication indispensable. Les Académies suisses des sciences soulignent l’importance d’un dialogue entre la science et le public dans le cadre de la communication scientifique, pour laquelle la demande publique a augmenté ces dernières années. La visualisation des données continue de jouer un rôle de communication important dans le contexte du coronavirus. Un tableau de bord, mis à disposition par l’OFSP, a la vocation de présenter au public la situation épidémiologique basée sur les données officielles en Suisse.

La visualisation des données est utilisée par l’équipe du DSCC au quotidien dans le cadre de tout projet en science des données. Les étapes du processus itératif en science des données qui peuvent bénéficier d’une visualisation des données sont explicitées ci-dessous.

L’étape de la formulation du problème

La visualisation des données peut aider à identifier les besoins spécifiques des utilisateurs. A l’aide d’une visualisation simple ou interactive (p. ex. un tableau de bord), un utilisateur pourrait identifier les tendances et les relations cachées dans les données. Cette approche permet alors de soulever un questionnement nécessitant une analyse approfondie. La visualisation peut également contribuer à identifier les limites des données disponibles. Il est dès lors possible de collecter de nouvelles données afin de combler ces lacunes.

L’étape de la collecte des données

La visualisation des données peut aider l’équipe scientifique à collecter les données de façon ciblée (p.ex. à l’aide des cartes montrant une distribution spatiale). En cas de données de mauvaise qualité (incomplètes ou manquantes), une collecte de données supplémentaire ou complétée par d’autres types de données pourrait être envisagée. Il est également possible de faciliter la récolte des données en donnant par exemple la possibilité aux utilisateurs de saisir les valeurs directement sur un tableau de bord interactif.

L’étape de la préparation et de l’analyse des données

La visualisation des données permet d’aider l’équipe scientifique à identifier rapidement les valeurs manquantes ou aberrantes dans les données.  

Par la suite, lors de l’analyse exploratoire des données, la visualisation permet également d’identifier les variables importantes et leur relation au sein d’une base de données. Les visualisations utilisées couramment dans ce contexte incluent les diagrammes à barres, les histogrammes et les nuages de points.

L’étape de l’évaluation et de l’interprétation des données

Les données générées lors de l’étape précédente servent à l’entraînement d’algorithmes (modélisation). La visualisation des données permet alors de suivre l’évolution des modèles établis et de comparer leur performance. Les visualisations les plus courantes dans ce contexte incluent les courbes de régression, les distributions spatiales d'une valeur prédite ou les courbes de prédiction des tendances.

L’étape de la mise à disposition des résultats

La communication des résultats bénéficie grandement d’une composante graphique. Les visualisations peuvent aider à rendre les résultats plus compréhensibles pour les non-experts. Ces graphiques peuvent par la suite être exposés dans les présentations et les rapports. Les visualisations couramment utilisées dans ce contexte incluent les graphiques à barres, les camemberts et les cartes.

L’augmentation constante des données et la complexité de leurs relations constituent un véritable défi dans le cadre de leur visualisation. La qualité des données et leur exactitude restent des composantes primordiales dans chaque représentation graphique. Afin de combler le fossé entre les spécialistes des données et l’ensemble des parties prenantes, l’Unlocking the Power of Data Initiative a été lancée par la Confédération et ses partenaires. Cette initiative vise à « faire progresser nos écosystèmes de données et à fournir les informations nécessaires à une vision du monde basée sur les faits ».

Dernière modification 27.02.2023

Haut de page

Contact

Office fédéral de la statistique
Centre de compétences en science des données DSCC

Espace de l'Europe 10
CH-2010 Neuchâtel
Suisse

Contact

Commentaires sur le blog

Pour tout commentaire sur notre blog, veuillez utiliser le formulaire ci-dessous.
Merci beaucoup !

Formulaire Blog DSCC

https://www.bfs.admin.ch/content/bfs/fr/home/dscc/blog/2023-01-visualisation.html