Comment l’Open Data peut fonctionner dans le secteur social
Dans le cadre de la numérisation des institutions sociales, une tension apparaît entre deux questions qui suscitent de plus en plus d’attention : la publication des données et la protection des données individuelles. Rendre les données accessibles présente certes divers avantages, mais aussi des risques. Ces considérations seront abordées lors du séminaire de deux jours Hack4SocialGood qui vise à soutenir les organisations sociales dans leurs préoccupations liées à la numérisation.
Les données administratives ouvertes et librement utilisables ont le potentiel d’améliorer les services, de promouvoir l’innovation, de transformer les institutions et d’améliorer la société en général en permettant aux chercheurs, aux journalistes de données et aux groupes d’intérêt public d’accéder aux données. Dans le cadre de la stratégie « Open Government Data » de l’administration fédérale, de plus en plus de données des cantons, des communes, des villes ou des entreprises proches de la Confédération sont donc mises à la disposition du public. Les données ouvertes sont également importantes dans la recherche fondamentale. Ainsi, le Fonds national suisse promeut le principe de rendre les données de recherche ouvertes et accessibles à la science et à la société, pour autant que la mise à disposition de données ouvertes ne viole aucun principe juridique ou éthique.
Bien que les avantages des données ouvertes semblent évidents, la pratique montre que les organisations du secteur de la santé et du secteur social, en particulier, mettent rarement leurs données à disposition de manière ouverte. Cela s’explique tout d’abord par le fait que les données dans ces secteurs sont particulièrement sensibles et doivent être protégées. D’autres risques concernent également d’autres services publics : Si le contrôle des données est abandonné, des analyses trompeuses ou erronées peuvent en être tirées. Dans le pire des cas, des données ouvertes mal préparées peuvent conduire à l’identification d’individus.
Possibilités de protection des individus
La réticence à l’égard des données ouvertes est également liée au manque de connaissances sur les mesures de sécurité existantes pour protéger les individus. Les données qui sont indissociablement liées à des personnes physiques ne peuvent pas être simplement mises à disposition de manière ouverte. Elles peuvent toutefois constituer la base d’un ensemble de données anonymisées ou statistiques.
En principe, les données personnelles doivent être complètement anonymisées et rendues méconnaissables lors d’une publication, afin qu’il ne soit pas possible de tirer des conclusions sur des individus. Les données personnelles telles que les noms, les adresses ou les numéros AVS doivent être supprimées, mais aussi les données qui permettent de ré-identifier une personne. Ces données ne sont pas d’intérêt général et leur publication pourrait constituer une violation des droits de la personnalité. En « masquant » ou en rendant méconnaissables d’autres caractéristiques clés, les données peuvent bénéficier d’une protection supplémentaire. Par exemple, la publication de l’année de naissance au lieu de la date de naissance offre plus d’anonymat.
Une autre catégorie d’anonymisation consiste à publier les données de manière groupée ou agrégée, c’est-à-dire qu’elles sont regroupées et généralisées selon certaines caractéristiques. Ainsi, les habitants* sont regroupés par commune de résidence, les dates de naissance sont divisées en intervalles de temps plus importants ou le niveau de qualification est mentionné au lieu de la profession. Les jeux de données synthétiques constituent une autre possibilité. Dans ce cas, des données entièrement nouvelles sont créées, qui ne reposent plus sur des personnes réelles mais présentent les mêmes corrélations que le jeu de données initial.
Au fur et à mesure que les données originales sont masquées, la protection de l’individu augmente et la ré-identification devient plus difficile. Toutefois, les possibilités et la précision du traitement ultérieur des données diminuent rapidement. Il convient donc de trouver un équilibre entre l’intérêt public et général et la protection individuelle. Il convient d’examiner et de peser le pour et le contre dans chaque cas concret pour savoir quelle est la procédure la plus judicieuse et la plus appropriée.
Une contribution à une numérisation inclusive
Le Hack4SocialGood réunit des personnes intéressées du secteur social et technologique afin de soutenir les institutions sociales dans leurs projets de données et de logiciels et de promouvoir ainsi des innovations justes et équitables dans le domaine social. Dans le cadre de cet événement, les organisations sociales seront aidées à rendre leurs données accessibles de manière sécurisée et temporaire. Les participants sont informés des nouvelles technologies d’accès aux données et du respect de la protection des données. Ils découvriront également la valeur des données ouvertes pour la création d’une communauté qui peut contribuer de manière décisive à la réalisation des objectifs dans le secteur social. Il est ainsi possible de faire un petit pas vers une utilisation ouverte et sûre des données, avec un échange et une participation accrus.
À propos du hackathon Hack4SocialGood
Le Hack4SocialGood réunit des personnes issues des domaines technique et social pour aider, lors d’un événement de deux jours, des organisations sociales à trouver des solutions à des préoccupations dans le domaine de la numérisation. Tout le monde peut s’engager lors de l’événement, quel que soit son parcours.
- Conférence : « Augmented Intelligence in the Digital Society of the Future », Mascha Kurpicz-Briki (Haute école spécialisée bernoise)
- Table ronde : « Social Organizations and the Challenge of Digitalization »
- Travail en équipe sur des défis (avec des pauses régulières pour se restaurer)
- 31. Mars, 13h30 – 1er avril 18h00 à la Maison des générations de Berne, Bahnhofplatz 2, Berne
- Programme encadré pour les enfants : 1er avril, 9h00-15h30
Littérature et liens
- Office fédéral de la statistique : Stratégie « Open Government Data » 2019-2023
- Gkoulalas-Divanis A, Mac Aonghusa P (2014) Privacy protection in open information management platforms. IBM Journal of Research and Development 58:2:1-2:11.
- Green B, Cunningham G, Ekblaw A, et al (2017) Open Data Privacy. Social Science Research Network, Rochester, NY
- Janssen M, Charalabidis Y, Zuiderwijk A (2012) Avantages, barrières à l’adoption et mythes de l’Open Data et de l’Open Government. Information Systems Management 29:258-268.
- Kostkova P, Brewer H, de Lusignan S, et al (2016) Who Owns the Data ? Les données ouvertes dans le domaine de la santé. Frontiers in Public Health 4
- Fonds national suisse : Open Research Data
- Sweeney L (2000) Simple Demographics Often Identify People Uniquely. Université Carnegie Mellon
- Young MM (2020) Implementation of Digital-Era Governance : The Case of Open Data in U.S. Cities. Public Administration Review 80:305-315.
Partenaire

Laisser un commentaire
Rejoindre la discussion?N’hésitez pas à contribuer !