BFH Applied Machine Intelligence à l’ACL 2025

ALC 2025

La 63ᵉ conférence annuelle de l’Association for Computational Linguistics (ACL 2025) s’est tenue du 27 juillet au 1er août 2025 au Austria Center Vienna. L’ACL est la conférence de référence mondiale en linguistique computationnelle et en traitement automatique du langage naturel (TALN), réunissant chercheurs académiques et industriels pour présenter les dernières avancées en compréhension automatique du langage, traduction, chatbots et autres applications.

Le thème principal de cette année était la « Généralisation des modèles de TALN », portant sur la manière dont les systèmes d’IA peuvent répondre de manière fiable et équitable à de nouvelles données inconnues. Le sujet a été exploré à travers des conférences plénières, des panels d’experts et des sessions thématiques. Plusieurs ateliers sur des sujets spécialisés ont eu lieu après les journées principales de la conférence.

Atelier sur le biais de genre dans le traitement automatique du langage (GeNLP)

Particulièrement pertinent pour les chercheurs du groupe Applied Machine Intelligence et du BFH Generative AI Lab dans le cadre du projet Horizon Europe BIAS [1], l’atelier Gender Bias in Natural Language Processing (GeBNLP) a offert une plateforme pour des discussions approfondies et la collaboration internationale sur le biais de genre en TALN. L’équipe y a présenté un article [2] avec des résultats issus du projet.

Les modèles linguistiques et autres systèmes basés sur le texte – comme les chatbots ou les outils de traduction automatique – apprennent des motifs à partir d’énormes volumes de textes disponibles en ligne. Si cette base de données les rend puissants et polyvalents, elle comporte également le risque d’intégrer et de reproduire des stéréotypes et biais sociaux. Par exemple, un modèle linguistique peut associer certaines professions à un genre spécifique ou montrer des biais négatifs envers certains groupes ethniques.

La recherche jusqu’ici s’est majoritairement concentrée sur les modèles en anglais et a souvent examiné un seul type de biais à la fois, comme le biais de genre.

L’article présenté adopte une approche plus large et inclusive, en examinant les biais individuels et intersectionnels dans les modèles italiens. Les chercheurs ont développé une méthode appelée GG-FISE, basée sur le framework FISE [3], prenant en compte le rôle particulier du genre grammatical en italien. Ils ont également adapté des jeux de données et tests existants en anglais à l’italien. Les expériences ont révélé des biais marqués dans la représentation de certains groupes ethniques et de genre, notamment les communautés roumaine et sud-asiatique. Ces résultats soulignent l’importance de développer des outils culturellement adaptés pour mieux détecter et corriger les biais dans différentes langues et identités sociales.

20250801 103143

Atelier BioNLP

Un autre point fort a été l’atelier BioNLP, organisé depuis 2002 par ACL en collaboration avec ACL SIGBioMed. Il est reconnu comme un forum de premier plan pour la recherche avancée en TALN appliqué aux domaines biomédicaux et cliniques, couvrant les méthodologies fondamentales jusqu’aux applications concrètes en santé.

Lors de l’édition 2025, plusieurs contributions ont été particulièrement pertinentes pour la BFH, notamment pour le groupe Applied Machine Intelligence et le BFH Generative AI Lab.

Un article notable, Converting Annotated Clinical Cases into Structured Case Report Forms [4], présente une méthodologie semi-automatique pour transformer des récits cliniques annotés en formulaires de rapport de cas (CRFs) structurés. Cette approche a été appliquée au jeu de données E3C en anglais et en italien. À la BFH, nous souhaitons explorer des méthodes similaires pour structurer les données cliniques, en particulier afin d’améliorer leur utilisabilité pour des applications basées sur l’IA.

Une autre contribution importante, Enhancing Stress Detection on Social Media [5], propose un nouveau cadre multimodal combinant données textuelles et indices visuels synthétiques pour améliorer la précision de la détection du stress. Cela correspond étroitement à notre projet en cours, Automatic Work-Related Stress Detection, visant à développer un cadre robuste d’apprentissage automatique multimodal pour détecter et surveiller le stress lié au travail, en particulier chez le personnel infirmier.

L’équipe de recherche de la BFH poursuit actuellement deux objectifs principaux :

Collecte et intégration de données :

  1. Signaux physiologiques issus de dispositifs portables (variabilité de la fréquence cardiaque, sommeil, activité)
  2. Textes cliniques non structurés provenant des systèmes d’information
  3. Auto-évaluations quotidiennes (échelle 0–10) du niveau de stress sur trois questions clés
  4. Plannings de travail détaillant charge, temps de repos et rythmes temporels

Pour soutenir cela, nous avons adopté un protocole d’étude longitudinale impliquant 24 infirmiers sur une période d’observation prolongée. En employant des mesures répétées, nous permettons une analyse dynamique des schémas de stress au fil du temps.

 


Références

[1] www.biasproject.eu

[2] Alexandre Puttick and Mascha Kurpicz-Briki. 2025. Detecting Bias and Intersectional Bias in Italian Word Embeddings and Language Models. In Proceedings of the 6th Workshop on Gender Bias in Natural Language Processing (GeBNLP), pages 33–51, Vienna, Austria. Association for Computational Linguistics.

Available at: https://aclanthology.org/2025.gebnlp-1.3/

[3] Tessa ES Charlesworth, Kshitish Ghate, Aylin Caliskan, and Mahzarin R Banaji. 2024. Extracting intersectional stereotypes from embeddings: Developing and validating the flexible intersectional stereotype extraction procedure. PNAS nexus, 3(3).

[4] Pietro Ferrazzi, Alberto Lavelli, and Bernardo Magnini. 2025. Converting Annotated Clinical Cases into Structured Case Report Forms. In Proceedings of the 24th Workshop on Biomedical Language Processing, pages 307–318, Viena, Austria. Association for Computational Linguistics.

[5] Efstathia Soufleri and Sophia Ananiadou. 2025. Enhancing Stress Detection on Social Media Through Multi-Modal Fusion of Text and Synthesized Visuals. In Proceedings of the 24th Workshop on Biomedical Language Processing, pages 34–43, Viena, Austria. Association for Computational Linguistics.

Creative Commons Licence

AUTHOR: Souhir Ben Souissi

Dr. Souhir Ben Souissi est professeur tenure track en ingénierie des données à l'Institut pour les applications de données et la sécurité (IDAS) de la HESB Technique & Informatique. Ses recherches portent notamment sur les systèmes décisionnels médicaux, les technologies web sémantiques et les systèmes décisionnels multicritères.

AUTHOR: Alexandre Puttick

Dr Alexandre Puttick est post-doctorant dans le groupe de recherche sur l'intelligence artificielle appliquée à la Haute école spécialisée bernoise. Ses recherches actuelles portent sur le développement d'outils cliniques pour la santé mentale ainsi que sur la détection et l'atténuation des biais dans les outils de recrutement pilotés par l'IA.

AUTHOR: Mascha Kurpicz-Briki

Dr. Mascha Kurpicz-Briki est professeure d'ingénierie des données à l'Institut pour les applications et la sécurité des données (IDAS) de la Haute école spécialisée bernoise et directrice adjointe du groupe de recherche Applied Machine Intelligence. Ses recherches portent notamment sur la question de l'équité et la numérisation des défis sociaux et communautaires.

Create PDF

Posts associés

Désolé, aucun article similaire n'a été trouvé.

0 réponses

Laisser un commentaire

Rejoindre la discussion?
N’hésitez pas à contribuer !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *