Souveraineté numérique, espaces de données et modèles de langage de grande taille

Digital Domain Sovereign Domain Of Data, Protected By An Impenetrable Cryptographic Fortress Generative Ai.デジタル領域 侵入不可能な暗号の要塞によって守られた、データの主権領域 Generative Ai.

Que signifie la « souveraineté numérique » dans la pratique, et quel est son lien avec les modèles de langage suisses (LLM) en cours de développement ? Cet article montre que la souveraineté numérique nécessite impérativement des LLM nationaux.

La souveraineté numérique constitue un objectif politique pour la Suisse, mais il est pratiquement impossible de l’atteindre dans sa totalité. La question se pose donc : dans quelle mesure cet objectif doit-il être réalisé ?

Pour des composants essentiels de l’écosystème numérique, la Suisse dépend de l’étranger. Mais l’Union européenne ne se trouve pas dans une position beaucoup plus avantageuse. Et même pour les États-Unis, la question de leur souveraineté numérique fait l’objet de débats. Quelle part de souveraineté numérique voulons-nous réellement ?

Formulée de manière plus modérée, cette ambition soulève trois questions. La première peut être rapidement tranchée : la Suisse est-elle numériquement vulnérable au chantage ? Réponse : fondamentalement, oui. Tout dépend de l’intensité de la menace. Mais cela vaut également pour l’Allemagne, dix fois plus grande. La véritable question est de savoir ce qui coûte le plus cher : résister ou céder au chantage. Si les coûts sont équivalents, il convient de résister. Même si les coûts de la résistance sont légèrement supérieurs. Mais il existe une limite au-delà de laquelle céder devient rationnel, parce que la résistance est tout simplement trop onéreuse. Sauf si céder reviendrait à aller trop loin.

Les moyens potentiels de chantage incluent : la coupure de l’accès à des technologies numériques critiques ou au système international de transactions financières, en plus des menaces classiques comme l’imposition de droits de douane massifs. Les objectifs possibles du chantage sont : le renoncement à réguler les plateformes numériques dominantes (ce que la Suisse a déjà proposé proactivement dans le cadre du conflit douanier avec les États-Unis), l’adaptation de lois (par exemple, celle sur l’eID, de sorte que des entreprises étrangères puissent délivrer des identités électroniques suisses), ou encore l’abrogation de lois existantes (comme la loi sur la protection des données ou la portabilité des données).

De telles mesures de rétorsion seraient bien plus coûteuses pour la Suisse que les frictions passées avec la Commission européenne, telles que l’exclusion du programme-cadre européen pour la recherche. Restreindre l’accès des banques suisses à des clients étrangers est une chose – beaucoup renoncent déjà à des clients américains. Mais si les banques suisses devaient être totalement coupées du monde numérique, elles seraient tout simplement condamnées.

Cependant, ces scénarios catastrophes sont peu réalistes, et l’impossibilité d’une immunité totale ne devrait donc pas inquiéter outre mesure. Ceux qui planifient pour l’improbable échouent souvent face au probable. Deux questions sont donc au cœur de la réflexion – et déterminantes aussi pour évaluer les coûts potentiels du chantage : Premièrement, la Suisse peut-elle développer des solutions numériques adaptées à ses besoins spécifiques, ou est-elle condamnée à utiliser des solutions conçues pour d’autres pays, qui ne correspondent pas à sa population ? Cette problématique, bien que parfois anecdotique, est fréquente dans la réalité informatique. On pense à ces responsables IT universitaires qui se plaignent que les directives rectorales ne cadrent pas avec leur système ERP.

Au-delà de telles singularités culturelles du monde IT, un exemple plus grave est celui de la recherche médicale suisse qui utilise des dossiers de santé américains. Ces données ne sont pas adaptées à la population suisse, du fait de différences dans le mode de vie, la génétique ou les systèmes de santé. Bien que des méthodes de Big Data permettent de réduire ce biais, la situation demeure éthiquement discutable. Il serait légitime que le gouvernement américain décide d’y mettre un terme. Si la Suisse interdit l’exportation de ses données vers les États-Unis, il serait logique de ne pas importer non plus de données américaines. Le problème est que très peu de données personnelles sont disponibles pour la recherche en Suisse. En matière de réutilisation secondaire des données, la Suisse est en net retard sur la Chine et les États-Unis.

Deuxième question : pouvons-nous préserver nos valeurs, ou devons-nous adopter celles de puissances technologiquement dominantes ? Posée objectivement, la question peut sembler étrange, mais elle est d’actualité. En Suisse, comme ailleurs en Europe, nombreux sont ceux qui espèrent utiliser la technologie pour combattre leurs adversaires politiques : création de « fact-checkers » pour contrer les fake news, par exemple. Autrement dit : diffuser des fake news crédibles sous couvert de vérification des faits – certaines entités en Allemagne ont d’ailleurs été condamnées pour cela. De même, la technologie est invoquée pour garantir la liberté d’expression. Mais nombre d’outils développés au nom de la liberté ont été récupérés par des forces politiques antidémocratiques ou par des criminels, ce qui contribue à affaiblir la démocratie libérale.

Tout cela illustre comment, même à l’intérieur du pays, des projets technologiques sont parfois utilisés pour miner la démocratie semi-directe suisse. La vraie question est donc : l’utilisation de technologies étrangères, fondées sur des valeurs étrangères, est-elle une fatalité ?

Ce débat n’est pas anodin. Dans la Silicon Valley, certaines visions très particulières du christianisme sont populaires : des entrepreneurs du numérique s’identifient à Jésus-Christ (Daub, 2020) (Thiel, 2014) et prétendent vouloir sauver le monde – y compris du « mal » que représenterait la démocratie libérale. Une telle position est certes légitime, mais lorsqu’elle est invisiblement intégrée dans des algorithmes, elle devient un instrument de pouvoir. C’est pourquoi il faut des alternatives aux services numériques étrangers : des outils qui intègrent nos propres valeurs. Pour la Suisse, cela signifie notamment : ouverture au débat d’idées, neutralité politique des services d’information (sauf mention contraire), et multilinguisme. Les solutions open source sont ici particulièrement souhaitables.

La première question évoquée montre clairement que nous – la Suisse, les autres pays européens, l’UE, l’Europe – avons besoin d’espaces de données souverains ! Cette thématique sera débattue en profondeur lors de la journée informatique juridique du 26 août à l’Hôtel de Ville de Berne. La seconde question montre qu’il est essentiel d’investir beaucoup plus dans l’open source, et ce tout particulièrement dans le domaine de l’intelligence artificielle.

Ce qu’il faut, ce sont des modèles d’IA formés localement, qui reflètent les logiques et les valeurs locales. Cela vaut en particulier pour les modèles de langage de grande taille (LLM). La Suisse a besoin de LLM développés selon ses propres valeurs. Concrètement, cela implique : aucune collecte illégale de données, pas d’utilisation de textes sans le consentement des ayants droit. Ces modèles doivent refléter les principes fondamentaux suisses – notamment l’égalité entre tous les êtres humains, et en particulier la non-discrimination des femmes – et intégrer le multilinguisme, un élément fondamental de la culture helvétique.

L’EPFZ et l’EPFL développeront ces LLM nationaux sur le nouveau superordinateur ALPS du Centre national suisse de calcul scientifique (CSCS) à Lugano, afin qu’ils puissent ensuite être déployés par des fournisseurs de services cloud. Cette tâche requiert expérience, temps et énergie, mais elle permet ensuite de réutiliser les acquis pour d’autres LLM spécialisés, de manière plus efficiente et écologique. À terme, les services d’ALPS seront également proposés aux entreprises privées suisses, accompagnés de prestations de conseil assurées par les hautes écoles. Lors du 7e Sommet numérique de Digital Switzerland au Bürgenstock, ces projets ont été largement présentés et discutés.

Le premier modèle à voir le jour sera le Swiss Justice Base Model, un LLM destiné au droit suisse. Ici, la nécessité d’une solution nationale est évidente : le droit est, à quelques exceptions près, une compétence nationale. Outre les décisions de justice publiées et anonymisées (grâce aux efforts du mouvement Open Access), les modèles seront entraînés à partir de textes juridiques fournis par des éditeurs avec l’accord des auteurs. Parallèlement, des principes de Fair Use adaptés au contexte suisse seront élaborés – ou plutôt plusieurs variantes de ces principes, parmi lesquelles les développeurs pourront choisir, en fonction de leur modèle de licence. Naturellement, seuls seront retenus ceux dont la compatibilité avec le droit suisse est incontestable.

Les spécialistes de la conduite du changement soulignent depuis longtemps l’importance des Quick Wins. Le Swiss Justice Base Model entend incarner l’un de ces succès sur le chemin vers une souveraineté numérique partielle.


Références

Daub, Adrian (2020). Was das Valley denken nennt (4. Aufl.). Suhrkamp.

Thiel, Peter (2014). Zero to one: notes on startups, or how to build the future. Chapter 14. 

Creative Commons Licence

AUTHOR: Reinhard Riedl

Le professeur Reinhard Riedl est chargé de cours à l'Institut Digital Technology Management de la HESB Économie. Il s'engage dans de nombreuses organisations et est membre du comité de pilotage de TA-Swiss. Il est en outre membre du comité directeur d'eJustice.ch, de Praevenire - Verein zur Optimierung der solidarischen Gesundheitsversorgung (Autriche) et d'All-acad.com, entre autres.

Create PDF

Posts associés

Désolé, aucun article similaire n'a été trouvé.

0 réponses

Laisser un commentaire

Rejoindre la discussion?
N’hésitez pas à contribuer !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *