Donner vie aux données ouvertes et les rendre tangibles grâce à des visualisations
Quels sont les membres du Grand Conseil qui interviennent le plus et avec qui ? Existe-t-il une collaboration entre les députés au-delà des clivages politiques ? Les hommes ont-ils tendance à travailler avec les hommes et les femmes avec les femmes ? Cet article de blog décrit comment la visualisation peut donner vie aux données ouvertes et les rendre tangibles, en utilisant des données sur les interventions parlementaires au Grand Conseil du canton de Thurgovie.
Je me suis posé les questions ci-dessus lorsque j’ai examiné les données du Grand Conseil du canton de Thurgovie dans le cadre du cours sur les données ouvertes à l’Université de Berne. Les données brutes, dans des tableaux Excel, avec des chiffres, des signes et des noms de variables incompréhensibles, peuvent parfois sembler arides et sans vie. Dans mon cas, il y avait deux tableaux de ce type : L’un avec les données sur les membres du Grand Conseil et l’autre avec les données sur les interventions déposées et leurs signataires* depuis 2012. Ma mission : donner vie aux données, les rendre visibles, tangibles et explorables. Cela est possible grâce à des visualisations interactives qui permettent d’accéder aux données de manière intuitive et ludique, de découvrir des liens et d’acquérir de nouvelles connaissances.
Trouver la bonne forme
Chaque ensemble de données contient une multitude de petites et grandes histoires. L’histoire que vous souhaitez raconter détermine la forme que doit prendre la visualisation. Voulez-vous montrer l’évolution dans le temps ou dans l’espace ? L’accent est-il mis sur les chiffres ou sur les relations ? Quelles sont les dimensions que je veux montrer et relier entre elles ? En fonction de la réponse à ces questions, une carte, un diagramme de Sankey ou un treemap peuvent être les plus appropriés. Des sites web tels que Datavizproject peuvent aider à obtenir une vue d’ensemble de la multitude de formes de visualisation et à choisir celle qui convient le mieux.
Les questions qui me préoccupaient tournaient principalement autour de la question de savoir qui soumet les propositions ensemble, avec qui et à quelle fréquence. La forme de visualisation que j’ai choisie est donc une visualisation en réseau, dans laquelle les députés sont représentés par des cercles et les interventions conjointes par des liens entre les députés.
Pétrir les données
Quiconque a déjà travaillé avec des données sait que chaque ensemble de données nécessite un certain travail jusqu’à ce que les données aient la forme et la qualité souhaitées. Souvent, les données doivent être tamisées et nettoyées comme les ingrédients d’une boulangerie, puis mélangées et pétries pour obtenir une pâte et enfin façonnées dans la forme souhaitée. C’est ce qui s’est passé dans ce cas. Prenons l’exemple des noms des députés, qui devaient être utilisés pour relier les deux ensembles de données des membres du conseil et des interventions déposées. Contrairement aux numéros d’identification, par exemple, les noms ne sont pas uniques et immuables. Il existe des surnoms, des doubles noms, des fautes d’orthographe et des changements de nom. Tous ces éléments se sont retrouvés dans mes données. Par exemple, un député est apparu sous trois noms différents (Gina Rüetschi, Regina Rüetschi et Regina Ruetschi-Fischer). Afin d’établir un lien clair entre la signature d’une intervention et un député, il fallait d’abord normaliser les noms.
La bonne base de code est la clé
Après avoir nettoyé et formaté les données, l’étape suivante consiste à construire la visualisation. Ceux qui, comme moi, n’ont que peu ou pas d’expérience en matière de visualisations interactives, ont besoin d’aide pour démarrer. Heureusement, il y en a beaucoup sur l’internet, à condition de savoir où et comment chercher. L’outil avec lequel je voulais travailler s’appelle D3.js et consiste en un cadre javascript pour les visualisations web interactives. Des tutoriels sur les bases sont disponibles sur Youtube , par exemple. Mais si vous avez une visualisation spécifique en tête, vous atteindrez rapidement vos limites avec des connaissances purement didactiques. La réponse se trouve dans les exemples de code. Sur Observable , par exemple, vous pouvez trouver des centaines de visualisations avec le code source correspondant. L’astuce consiste à trouver la visualisation qui correspond le mieux à vos idées et à l’utiliser comme structure de base, que vous pouvez ensuite raccourcir, transformer et étendre jusqu’à ce que votre propre visualisation prenne forme. Dans mon cas, il m’a fallu deux tentatives avant de trouver le bon point de départ : un exemple minimal de réseau simple basé sur les forces avec une fonction de filtrage.
Laissez-vous surprendre
Même si vous avez une idée claire et le bon outil, les choses ne se passent pas toujours comme prévu. Les données peuvent parfois nous surprendre en allant à l’encontre de nos attentes intuitives concernant leur contenu et leur structure. Au début, j’ai supposé que la collaboration d’un:MP donné était limitée à un cercle relativement restreint de personnes. Au cours du développement de la visualisation, il s’est avéré que les députés du Grand Conseil étaient beaucoup plus interconnectés que je ne l’avais supposé. En fait, ils étaient tellement interconnectés que l’image ressemblait plus à une pelote de laine qu’à un réseau (Fig. 1). Il était presque impossible de tirer des conclusions de cette visualisation. La solution a consisté à revenir à l’essence même des questions que je voulais poser à la visualisation : Quels sont les réseaux du Grand Conseil qui collaborent régulièrement ? Pour parvenir à ce gain de connaissances, j’ai dû réduire le contenu de l’information. Dans la visualisation finale, seuls les liens sont désormais affichés par défaut lorsque deux députés ont signé au moins trois interventions ensemble. Le résultat est une image claire des collaborations régulières (Fig. 2).
Conclusions de l’étude
La visualisation réalisée nous permet d’explorer les données et de tirer nos propres conclusions de manière ludique. Nous pouvons maintenant répondre aux questions du début :
1. Quels sont les membres du Grand Conseil qui déposent le plus d’interventions et auprès de qui ?
Le nombre d’interventions qu’un député a déposées entre 2012 et 2021 tend à augmenter avec le nombre d’années de service depuis 2012. Toni Kappeler (PG) est celui qui a déposé le plus d’interventions, ayant participé à 51 d’entre elles en 10 ans. Toni Kappeler (PSE) et Josef Gemperle (PDC) ont travaillé ensemble le plus souvent, ayant déposé 11 interventions en 10 ans (dont 8 sur le thème de l’énergie). Ce résultat fait également partie de la réponse à la question suivante.
2. Existe-t-il une coopération entre les députés au-delà des clivages politiques ?
Oui, il y a beaucoup de coopération entre les partis. Certains députés, comme Elisabeth Rickenbach (PPE), collaborent même plus souvent avec des députés d’autres partis qu’avec leurs collègues de parti. Cependant, c’est précisément dans le contexte d’une coopération régulière que les réseaux intra-partisans émergent (Fig. 2).
3. Les hommes ont-ils tendance à travailler avec des hommes et les femmes avec des femmes ?
Sur les 264 députés qui ont siégé au Grand Conseil entre 2012 et 2021, deux tiers sont des hommes et un tiers des femmes. Si l’on visualise le sexe des députés, on constate que le réseau peut être divisé en une partie dominée par les femmes et une partie dominée par les hommes (fig. 3).
Une partie de l’explication de cette séparation réside à nouveau dans les réseaux internes des partis. Le réseau dominé par les femmes est en grande partie composé de députés du PS qui, avec 60 %, a une proportion de femmes nettement supérieure à la moyenne.
Une deuxième raison de cette séparation visible peut résider dans les thèmes des interventions déposées. Alors que les interventions sur le thème des transports, par exemple, sont principalement faites par des hommes, celles sur les questions sociales ont tendance à être faites par des femmes.
Si cela a éveillé votre curiosité, vous pouvez découvrir de nombreuses autres histoires à l’aide de la visualisation en direct.
Données et visualisations du gouvernement ouvert
J’espère avoir pu montrer que les visualisations interactives sont capables de transformer des données arides en histoires vivantes et passionnantes. Souvent, l’utilité des ensembles de données gouvernementales ouvertes sur des sujets obscurs et supposés inintéressants peut sembler limitée. Pourtant, les visualisations nous aident à découvrir les histoires contenues dans les données. Des histoires qui nous permettent de jeter un coup d’œil dans les coulisses de la politique, de l’économie et de la société, qui créent de la transparence, révèlent des liens et encouragent de nouvelles idées. Dans le même temps, chaque visualisation et application permet d’identifier les problèmes potentiels liés aux données et donc d’en améliorer la qualité. Les données publiques ouvertes sont la base d’une société informée, critique, innovante et interconnectée, et les visualisations aident à développer ce potentiel.
Cet article a été publié pour la première fois sur Open Government Data du canton de Thurgovie. Sur ces pages, vous trouverez des informations sur l’Open Government Data (OGD) dans le canton de Thurgovie, des événements, des articles de presse et des applications ainsi que le blog de l’OGD.
Laisser un commentaire
Rejoindre la discussion?N’hésitez pas à contribuer !