BFH Applied Machine Intelligence an der ACL 2025

ALC 2025

Die 63. Jahrestagung der Association for Computational Linguistics (ACL 2025) fand vom 27. Juli bis 1. August 2025 im Austria Center Vienna statt. Die ACL gilt als weltweit führende Konferenz im Bereich der Computerlinguistik und des Natural Language Processing (NLP). Sie bringt Forschende aus Wissenschaft und Industrie zusammen, um die neuesten Fortschritte im maschinellen Sprachverstehen, in der maschinellen Übersetzung, bei Chatbots und weiteren Anwendungen zu präsentieren.

Das diesjährige Hauptthema lautete „Generalisierung von NLP-Modellen“. Im Fokus stand die Frage, wie KI-Systeme zuverlässig und fair auf neue, unbekannte Daten reagieren können. Dieses Thema wurde in Keynotes, Podiumsdiskussionen und speziellen Konferenztracks vertieft. Im Anschluss an die Hauptkonferenztage fanden mehrere Workshops zu spezifischen Fragestellungen statt.

Workshop zu Gender Bias im Natural Language Processing (GeNLP)

Besonders relevant für die Forschenden der BFH-Forschungsgruppe Applied Machine Intelligence und des BFH Generative AI Lab war der Workshop Gender Bias in Natural Language Processing (GeBNLP). Im Rahmen des Horizon-Europe-Projekts BIAS [1] bot er eine Plattform für intensive Diskussionen und internationale Zusammenarbeit zum Thema Gender Bias in NLP. Hier präsentierte das Team ein Paper [2] mit Ergebnissen aus dem Projekt.

Sprachmodelle und andere textbasierte KI-Systeme – wie Chatbots oder automatische Übersetzungstools – lernen Muster aus enormen Mengen frei zugänglicher Texte im Internet. Diese Datengrundlage macht sie leistungsfähig und vielseitig, birgt jedoch das Risiko, dass auch schädliche Stereotype und soziale Verzerrungen (Bias) übernommen und verstärkt werden. So können Sprachmodelle etwa bestimmte Berufe stark mit einem Geschlecht verknüpfen oder negative Verzerrungen gegenüber bestimmten ethnischen Gruppen reproduzieren.

Die bisherige Forschung konzentrierte sich überwiegend auf englische Sprachmodelle und betrachtete meist nur einen Bias-Typ, etwa den Gender Bias, isoliert.

Das präsentierte Paper verfolgt einen breiteren, inklusiveren Ansatz: Es untersucht individuelle und intersektionale Biases in italienischen Sprachmodellen. Dazu entwickelten die Forschenden eine Methode namens GG-FISE, die auf dem FISE-Framework [3] basiert und die besondere Rolle des grammatischen Geschlechts im Italienischen berücksichtigt. Zudem wurden bestehende englische Datensätze und Testverfahren für das Italienische angepasst. Die Experimente zeigten deutliche Verzerrungen in der Darstellung bestimmter ethnischer und geschlechtsspezifischer Gruppen, insbesondere in Bezug auf die rumänische und die südasiatische Community. Diese Ergebnisse unterstreichen die Notwendigkeit, kulturell angepasste Werkzeuge zu entwickeln, um Bias in verschiedenen Sprachen und sozialen Identitäten wirksam zu erkennen und zu mindern.

20250801 103143

Workshop zu BioNLP

Ein weiterer Höhepunkt war der BioNLP-Workshop, der seit 2002 durch ACL in Zusammenarbeit mit der ACL SIGBioMed durchgeführt wird. Er gilt als führendes Forum für aktuelle Forschung im Bereich Natural Language Processing für biomedizinische und klinische Anwendungen – von methodischen Grundlagen bis zu praxisnahen Anwendungen im Gesundheitswesen.

Bei der Ausgabe 2025 waren mehrere Beiträge für die BFH besonders relevant, insbesondere für die Applied Machine Intelligence Research Group und das BFH Generative AI Lab.

Ein besonders bemerkenswerter Beitrag, Converting Annotated Clinical Cases into Structured Case Report Forms [4], stellt eine semi-automatische Methodik vor, um annotierte klinische Fallbeschreibungen in strukturierte Fallberichtsformulare (CRFs) zu überführen. Dieser Ansatz wurde auf den E3C-Datensatz sowohl in Englisch als auch in Italienisch angewendet. An der BFH möchten wir ähnliche Methoden zur Strukturierung klinischer Daten erforschen, insbesondere im Hinblick auf die Verbesserung der Datenverwendbarkeit für KI-gestützte Anwendungen.

Ein weiterer hochrelevanter Beitrag ist Enhancing Stress Detection on Social Media [5], der ein neuartiges multimodales Framework präsentiert, das Textdaten mit synthetischen visuellen Hinweisen kombiniert, um die Genauigkeit der Stresserkennung zu verbessern. Dies steht in engem Zusammenhang mit unserem laufenden Projekt Automatic Work-Related Stress Detection, das ein robustes, multimodales Machine-Learning-Framework zur Erkennung und Überwachung arbeitsbedingten Stresses entwickeln soll, speziell bei Pflegefachpersonen.

Das BFH-Forschungsteam verfolgt derzeit zwei zentrale Ziele:

  1. Datenerhebung und -integration:
    1. Physiologische Signale aus Wearables (z. B. Herzfrequenzvariabilität, Schlaf- und Aktivitätsmuster)
    2. Unstrukturierte klinische Texte aus Informationssystemen
    3. Tägliche Selbsteinschätzungen (Skala 0–10) zum Stressniveau anhand von drei Kernfragen
    4. Dienstpläne mit Angaben zu Arbeitsbelastung, Ruhezeiten und zeitlichen Mustern
  2. Multimodales Modell-Design und Evaluation:
    Entwicklung von Machine-Learning-Modellen, die komplexe Zusammenhänge zwischen den verschiedenen Datenmodalitäten erfassen und mit Stressindikatoren verknüpfen können.

Zur Unterstützung dieses Vorhabens haben wir ein longitudionales Studiendesign mit 24 Pflegefachpersonen über einen längeren Beobachtungszeitraum gewählt. Durch wiederholte Messungen wird eine dynamische Analyse der Stressmuster im Zeitverlauf ermöglicht.

 


Referenzen

[1] www.biasproject.eu

[2] Alexandre Puttick and Mascha Kurpicz-Briki. 2025. Detecting Bias and Intersectional Bias in Italian Word Embeddings and Language Models. In Proceedings of the 6th Workshop on Gender Bias in Natural Language Processing (GeBNLP), pages 33–51, Vienna, Austria. Association for Computational Linguistics.

Available at: https://aclanthology.org/2025.gebnlp-1.3/

[3] Tessa ES Charlesworth, Kshitish Ghate, Aylin Caliskan, and Mahzarin R Banaji. 2024. Extracting intersectional stereotypes from embeddings: Developing and validating the flexible intersectional stereotype extraction procedure. PNAS nexus, 3(3).

[4] Pietro Ferrazzi, Alberto Lavelli, and Bernardo Magnini. 2025. Converting Annotated Clinical Cases into Structured Case Report Forms. In Proceedings of the 24th Workshop on Biomedical Language Processing, pages 307–318, Viena, Austria. Association for Computational Linguistics.

[5] Efstathia Soufleri and Sophia Ananiadou. 2025. Enhancing Stress Detection on Social Media Through Multi-Modal Fusion of Text and Synthesized Visuals. In Proceedings of the 24th Workshop on Biomedical Language Processing, pages 34–43, Viena, Austria. Association for Computational Linguistics.

 

Creative Commons Licence

AUTHOR: Mascha Kurpicz-Briki

Dr. Mascha Kurpicz-Briki ist Professorin für Data Engineering am Institute for Data Applications and Security IDAS der Berner Fachhochschule, und stellvertretende Leiterin der Forschungsgruppe Applied Machine Intelligence. Sie beschäftigt sich in ihrer Forschung unter anderem mit dem Thema Fairness und der Digitalisierung von sozialen und gesellschaftlichen Herausforderungen.

AUTHOR: Alexandre Puttick

Dr. Alexandre Puttick ist Post-Doktorand in der Forschungsgruppe Angewandte Maschinelle Intelligenz an der Berner Fachhochschule. Seine aktuelle Forschung befasst sich mit der Entwicklung von klinischen Tools für die psychische Gesundheit sowie mit der Erkennung und Abschwächung von Verzerrungen in KI-gesteuerten Rekrutierungs-Tools.

AUTHOR: Souhir Ben Souissi

Dr. Souhir Ben Souissi ist Tenure-Track-Professorin für Data Engineering am Institut für Datenanwendungen und Sicherheit (IDAS) der BFH Technik & Informatik. Ihre Forschungsschwerpunkte liegen unter anderem auf den Themen Medizinische Entscheidungssysteme, Semantische Webtechnologien und Multikriterielle Entscheidungssysteme.

Create PDF

Ähnliche Beiträge

Es wurden leider keine ähnlichen Beiträge gefunden.

0 Kommentare

Dein Kommentar

An Diskussion beteiligen?
Hinterlasse uns Deinen Kommentar!

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert