Wie Künstliche Intelligenz Burnouts über Spracheingaben erkennt
Computer werden täglich mit Wörtern und Sätzen gefüttert. In diesen Daten können trainierte Programme Muster erkennen oder sogar vorhersagen. Wissenschaftler*innen der Forschungsgruppe Applied Machine Intelligence am Departement Technik & Informatik der BFH wollen nun diese Möglichkeit für die Gesundheitsprävention nutzen. Konkret: Können zur effizienteren Burnouterkennung im klinischen Umfeld Methoden der Computerlinguistik angewendet werden? Diese Frage geht das Projekt BurnoutWords nach.
Eine Studie in der Schweiz [1] schätzte, dass 24.2% der Angestellten oft oder immer gestresst sind am Arbeitsplatz, und 35.2% sich meistens (22.2%) oder immer (13%) erschöpft fühlen am Ende des Arbeitstages. Manchmal kann so ein chronischer Stress am Arbeitsplatz zu einem Burnout führen. Die Weltgesundheitsorganisation WHO hat das Burnout 2019 in der 11th Revision of the International Classification of Diseases (ICD-11) als Syndrom aufgenommen [2].
Die klinische Erkennung dieses Syndroms gestaltet sich manchmal schwierig, da die Symptome oftmals mit anderen Syndromen oder Krankheitsbildern überlappen, beispielsweise mit Depression. In der klinischen Psychologie werden Fragebögen (inventories) verwendet, um Burnout zu identifizieren, welche auf Multiple-Choice-Fragen zum Ankreuzen basieren (z.B. das Maslach Burnout Inventory [3]). In der Fachliteratur wird dieses Vorgehen, auch wenn es sich bewährt hat und regelmässig in Studien und im klinischen Alltag eingesetzt wird, teilweise in Frage gestellt. Probleme mit solchen Fragebögen können sein, dass Patient*innen nicht ehrlich antworten (z.B., [4][5]) oder die extremeren Antworten meiden (oder besonders oft auswählen) [6][7].
Viel Potenzial liegt in der Erweiterung solche Fragebögen mit offenen Fragen, oder der Analyse von Transkripten von Gesprächen. Bisher haben sich solche Ansätze auf Grund der aufwendigen manuellen Auswertung jedoch noch nicht durchgesetzt.
Anwendung von Computerlinguistik und maschinellem Lernen
Mittels Methoden aus der Computerlinguistik und mit Hilfe von maschinellem Lernen soll dies jedoch in Zukunft möglich sein, und neue Methoden für die klinische Psychologie/Psychiatrie ermöglichen. Das Projekt BurnoutWords, welches durch den Schweizerischen Nationalfonds SNF und die Hasler Stiftung unterstützt wird, untersucht an dem Beispiel Burnouterkennung, wie Hinweise auf ein Syndrom oder eine Diagnose in Texten automatisch erkannt werden können. Diese Grundlagenforschung ermöglicht später die Entwicklung neuer Methoden unter Einbezug von natürlicher Sprache, zur Ergänzung der bestehenden Fragebögen.
Die grosse Herausforderung liegt dabei in der Tatsache, dass solche Methoden sehr datenhungrig sind und Textbeispiele von betroffenen Personen in genügend grosser Menge benötigt werden. Selten kann auf Daten aus vergangenen Studien zurückgegriffen werden, jedoch ist die Wiederverwendung solcher Daten oftmals aus datenschutzrechtlichen Gründen nicht möglich. Um die Methoden zu entwickeln und initial zu testen, haben die Forschenden daher zunächst auf anonymisierte Texte aus Online-Foren zurückgegriffen, analog zu bestehender Forschung für Depressionserkennung [8]. In einem nächsten Schritt sollen die Methoden dann mit einem Dataset, welches in Zusammenarbeit mit klinischen Institutionen erstellt wird, weiter getestet und verbessert werden.
BurnoutEnsemble
Die Forschenden konnten zeigen, dass Methoden aus dem Bereich der Computerlinguistik vielversprechend sind. In einer wissenschaftlichen Publikation, welche diesen Monat im Journal Frontiers in Big Data veröffentlicht wurde [9], wurden die Resultate beschrieben.
Anonymisierte Texte von der Online-Plattform Reddit wurden, je nach Thread in dem sie publiziert wurden und teilweise mittels manueller Selektion, in drei Kategorien eingeteilt: Burnout, Depression und eine Kontrollgruppe aus diversen anderen Themen. Basierend darauf wurden verschiedene Systeme (sog. Classifier) mittels maschinellen Lernens trainiert. Um ein bestmögliches Ergebnis zu erzielen, wurden diese Systeme dann zu einem sogenannten Ensemble Classifier kombiniert. Ein Textabschnitt, der mittels des Systems ausgewertet werden soll, wird durch die verschiedenen Classifier evaluiert, welche feststellen, ob eine Indikation für Burnout vorliegt. Durch eine Abstimmung über diese verschiedenen Ergebnisse der einzelnen Classifier legt der Ensemble Classifier dann fest, ob insgesamt von einer Indikation für Burnout ausgegangen werden soll, oder nicht.
Das vorgeschlagene System bewegt sich im Feld der Augmented Intelligence und würde in einem späteren Einsatz die klinische Fachperson unterstützen. Augmented Intelligence hat das Ziel, Menschen mittels künstlicher Intelligenz bei ihren täglichen Aufgaben zu unterstützen, und nicht zu ersetzen.
Was kommt als nächstes?
Die Resultate aus diesem initialen Projekt, welches die Grundlagen erforscht, sind vielversprechend und müssen nun weiter validiert werden. Einerseits sollen in Zusammenarbeit mit klinischen Partnern Textdaten von Burnout Betroffenen gesammelt werden. Die Systeme, basierend auf den in dieser ersten Phase verwendeten Daten aus Online-Foren, müssen validiert werden. Ausserdem ermöglicht dieses Vorgehen es, die Methoden auch für andere Sprachen wie Deutsch und Französisch zu testen. Auf Grund der Datenverfügbarkeit wurde in der obenstehenden Studie mit Englisch gearbeitet. Wegen der vollständig anonymisierten Daten in dieser Studie müssen ausserdem die Trainingsdaten erweitert werden, um ein Bias zu verhindern. Es muss sichergestellt werden, dass die finalen Trainingsdaten für ein solches System alle Gruppen der Gesellschaft möglichst gut abdecken.
Acknowledgement
Die Forschungsgruppe Applied Machine Intelligence bedankt sich beim Schweizerischen Nationalfonds SNF und der Hasler Stiftung für die Unterstützung des Projekts.
Referenzen
- [1] SECO (2015). The Sixth European Working Conditions Survey (EWCS).
- [2] https://icd.who.int/browse11/l-m/en#/http://id.who.int/icd/entity/129180281
- [3] Maslach, C., Jackson, S. E., & Leiter, M. P. (1997). Maslach burnout inventory. Scarecrow Education.
- [4] Holden, R. R. (2007). Socially desirable responding does moderate personality scale validity both in experimental and in nonexperimental contexts. Can. J. Behav. Sci./Revue canadienne des sciences du comportement 39, 184. doi: 10.1037/cjbs2007015
- [5] Lambert, C. E. (2013). Identifying Faking on Self-Report Personality Inventories: Relative Merits of Traditional Lie Scales, New Lie Scales, Response Patterns, and Response Times (Kingston, ON: Queen’s University).
- [6] Greenleaf, E. A. (1992). Measuring extreme response style. Publ. Opin. Q. 56, 328–351.
- [7] Brulé, G., and Veenhoven, R. (2017). The ‘10 excess’ phenomenon in responses to survey questions on happiness. Soc. Indicators Res. 131, 853–870. doi: 10.1007/s11205-016-1265-x
- [8] Tadesse, M. M., Lin, H., Xu, B., and Yang, L. (2019). Detection of depression-related posts in reddit social media forum. IEEE Access 7, 44883–44893. doi: 10.1109/ACCESS.2019.2909180
- [9] Merhbene, G., Nath, S., Puttick, A.R. and Kurpicz-Briki, M. (2022). BurnoutEnsemble: Augmented Intelligence to Detect Indications for Burnout in Clinical Psychology. Front. Big Data 5:863100. doi: 10.3389/fdata.2022.863100