Pourquoi l’IA ne peut pas encore générer des diagrammes de processus métier

La Business Process Model and Notation (BPMN) s’est imposée comme le standard pour la documentation des flux de travail au sein des entreprises. Toutefois, la création et la maintenance de diagrammes de processus précis exigent une expertise dont de nombreuses organisations ne disposent pas. Les grands modèles de langage (LLM) pourraient changer cet état de fait : la description d’un flux de travail en langage naturel permettrait de générer automatiquement un diagramme BPMN correct. Bien que la technologie semble mûre, les LLM actuels ne sont pas en mesure de produire des résultats fiables et conformes aux standards. Un projet mené au sein de la Haute école spécialisée bernoise (BFH), département Technique et Informatique, a analysé les raisons de cette limitation.

Introduction

Les grands modèles de langage tels que ChatGPT ou Claude sont désormais capables de générer, à partir du langage naturel, non seulement du texte mais également des résultats structurés. Cette évolution ouvre une perspective évidente : l’automatisation de la création de diagrammes de processus professionnels, susceptible de réduire le fossé entre les experts métier et les modélisateurs techniques (Li & Toxtli, 2024).

Le besoin est manifeste. Dans l’économie interconnectée actuelle, des processus transparents et standardisés sont indispensables. BPMN 2.0 offre une méthode uniforme de représentation des processus métier, interopérable entre différentes plateformes. Elle facilite la communication entre les départements métiers et informatiques, soutient l’analyse et l’automatisation des processus et favorise l’amélioration continue (Object Management Group, 2011).

Cependant, un problème subsiste. Malgré ses promesses théoriques, la mise en œuvre pratique se heurte à des obstacles considérables. Une modélisation isolée aboutit rarement à des modèles BPMN valides, en particulier lorsque les processus sont complexes.

Pourquoi les LLM rencontrent-ils des difficultés dans la génération de BPMN ? Quels sont les principaux défis à surmonter avant de pouvoir s’appuyer sur une modélisation automatisée des processus ?

Pourquoi la modélisation des processus est moins simple qu’il n’y paraît

BPMN 2.0 s’est imposée comme le standard international de la modélisation des processus métier. Sa notation graphique établit un lien entre les parties prenantes métier, responsables de la conception des processus, et les équipes techniques chargées de leur implémentation. Elle couvre l’ensemble du cycle de vie des processus, de la documentation à l’optimisation, jusqu’à l’automatisation (Dumas et al., 2018).

Des organisations de tous secteurs s’appuient sur BPMN. Les établissements de santé documentent les parcours patients de l’admission à la sortie. Les services financiers modélisent des flux de conformité. Les entreprises industrielles coordonnent leurs chaînes d’approvisionnement. Les administrations publiques standardisent les services aux citoyens.

Malgré cela, la majorité des organisations éprouvent des difficultés à produire une documentation BPMN précise. La raison est simple : la modélisation manuelle requiert une connaissance approfondie à la fois du domaine métier et de la notation elle-même.

Prenons l’exemple du service des urgences d’un hôpital. Un expert clinique maîtrise le triage, le diagnostic, les décisions thérapeutiques et les protocoles de sortie. Pour traduire ces activités en un modèle BPMN valide, il faut toutefois comprendre les passerelles (gateways), les événements, les flux de séquence et les pools. Une décision thérapeutique doit-elle être modélisée à l’aide d’une passerelle exclusive ou parallèle ? À quel moment un sous-processus est-il nécessaire ? Comment représenter les exceptions ? Des études montrent que les personnes travaillant avec BPMN commettent fréquemment des erreurs en raison d’une compréhension insuffisante de la sémantique de la notation ou du domaine métier (Haisjackl et al., 2018).

Cette lacune documentaire freine la transformation numérique. Les entreprises ne peuvent ni optimiser ni automatiser des processus qu’elles n’ont pas correctement documentés. Or, elles manquent souvent de personnel possédant à la fois une expertise métier et une maîtrise de la modélisation BPMN, et le recrutement de tels profils est coûteux et long.

Pourquoi les LLM ne peuvent pas générer BPMN de manière fiable

Les diagrammes BPMN ne sont pas de simples représentations visuelles, mais des documents XML formellement structurés, soumis à des règles syntaxiques et sémantiques strictes. Un modèle de processus métier typique comprend des dizaines, voire des centaines d’éléments interconnectés : tâches, passerelles, événements, flux de séquence, pools, couloirs (lanes) et artefacts. Chaque élément possède des attributs spécifiques et doit respecter des relations valides avec les autres éléments.

Les règles sont strictes. Un flux de séquence doit relier exactement deux flownodes. Les passerelles exigent, selon leur type, des connexions entrantes et sortantes appropriées. Les événements intermédiaires attachés doivent être correctement liés aux activités. La moindre violation rend l’ensemble du fichier XML invalide et impossible à importer dans les outils BPMN.

Cette rigidité structurelle contraste fortement avec le langage naturel, où de légères erreurs grammaticales entravent rarement la compréhension. En BPMN, aucune approximation n’est tolérée : soit la sortie est valide, soit elle ne l’est pas.

Les processus complexes dépassent les limites du contexte

Même les LLM les plus avancés opèrent dans des fenêtres de contexte limitées. Lors du traitement de descriptions de processus volumineuses ou détaillées, les modèles perdent des informations relatives aux éléments générés précédemment au moment de produire les parties suivantes. Ce problème devient particulièrement critique dans les flux de travail complexes comportant des branches parallèles, des mécanismes de gestion des exceptions ou des hiérarchies de sous-processus.

Le modèle doit conserver une vue d’ensemble de tous les éléments déjà générés afin de garantir une connectivité correcte et d’éviter les identifiants dupliqués, ce qui dépasse souvent ses capacités.

Connaître BPMN n’est pas équivalent à le créer

Les LLM peuvent être entraînés à partir de spécifications BPMN, de tutoriels et de diagrammes d’exemple. Ils disposent ainsi d’une connaissance théorique des concepts BPMN et peuvent décrire avec précision les différents éléments et leurs usages. Toutefois, cette connaissance théorique ne se traduit pas automatiquement par une capacité de génération pratique.

La création de fichiers XML BPMN valides nécessite des calculs précis de coordonnées pour le positionnement des éléments, des déclarations correctes des espaces de noms, une gestion rigoureuse des identifiants sur des centaines d’éléments et le respect de conventions de mise en page. Les LLM ne disposent pas des boucles de raffinement itératif utilisées par les modélisateurs humains. Un expert humain construit progressivement un diagramme et ajuste les positions et connexions sur la base d’un retour visuel. Un LLM, en revanche, doit générer l’ensemble de la structure XML en une seule passe, sans possibilité de « voir » ni de corriger le résultat.

Chaque exécution produit un diagramme différent

Plus fondamentalement encore, les LLM sont des modèles génératifs qui produisent des résultats différents à chaque exécution. Lorsqu’un même LLM est sollicité deux fois pour générer un diagramme BPMN à partir d’une entrée identique, les résultats diffèrent.

Ce comportement non déterministe est inhérent au fonctionnement des LLM. Or, pour la modélisation des processus, cela pose un problème majeur. Les organisations ont besoin d’une documentation stable et reproductible. Un flux d’approvisionnement documenté aujourd’hui doit rester cohérent demain. Les LLM génèrent toutefois à chaque exécution des identifiants d’éléments différents, des mises en page distinctes et parfois des interprétations divergentes d’une même description de processus. Cela rend la gestion des versions presque impossible et compromet l’objectif fondamental de la documentation des processus : fournir une référence stable sur laquelle l’organisation peut s’appuyer, qu’elle peut analyser et améliorer au fil du temps.

Les modélisateurs humains produisent des résultats cohérents parce qu’ils s’appuient sur un modèle mental stable et maintiennent volontairement la continuité. Les LLM, en revanche, génèrent à partir de distributions probabilistes, ce qui rend la cohérence inter-exécutions intrinsèquement difficile.

Les diagrammes professionnels exigent une mise en page professionnelle

Au-delà de la validité structurelle, les diagrammes BPMN professionnels doivent respecter des standards visuels garantissant leur lisibilité. Des normes telles que eCH-0158 (eCH, 2020) définissent des conventions concernant l’espacement des éléments, la direction des flux, l’alignement et le positionnement des annotations.

BPMN-Modellierung

Figure : Exemples de modélisation BPMN conforme et non conforme selon la norme eCH-0158 (source : eCH-0158).

Les diagrammes générés par des LLM présentent fréquemment des problèmes de mise en page : formes qui se chevauchent et masquent les libellés, flux de séquence qui se croisent et créent de la confusion, espacements incohérents et éléments mal alignés ne respectant pas les standards professionnels. Si ces défauts n’affectent pas toujours la validité technique, ils réduisent considérablement l’utilité pratique des diagrammes.

Perspectives

L’automatisation de la création de diagrammes de processus métier pourrait démocratiser la documentation des processus et accélérer la transformation numérique. Toutefois, les LLM actuels se heurtent à des défis fondamentaux qui les empêchent de produire de manière fiable des sorties BPMN valides et conformes aux standards.

La complexité des exigences structurelles de BPMN, les limitations des fenêtres de contexte pour les processus de grande taille, l’écart entre connaissance théorique et capacité de génération pratique, le non-déterminisme inhérent aux modèles génératifs et la difficulté de la mise en page automatisée contribuent tous à l’inefficacité des approches à modèle unique. Des travaux connexes confirment ces limites pour différents types de diagrammes et contextes d’application, et s’accordent sur la nécessité d’une validation humaine afin de garantir la qualité des résultats.

Pour relever ces défis, il est nécessaire d’aller au-delà de simples stratégies de prompting et de développer des innovations architecturales capables de décomposer la complexité, d’imposer des contraintes, d’assurer la reproductibilité et de valider systématiquement les résultats. Le développement de telles approches constitue une orientation essentielle pour la recherche future en modélisation des processus assistée par l’IA.


Références

Dumas, M., La Rosa, M., Mendling, J., & Reijers, H. A. (2018). Fundamentals of business process management (2nd ed.). Springer. https://doi.org/10.1007/978-3-662-56509-4

eCH. (2020). Standard for business process modeling eCH-0158 (Version 1.2). eGovernment Switzerland. https://www.ech.ch/de/ech/ech-0158/1.2

Haisjackl, C., Soffer, P., Lim, S. Y., & Weber, B. (2018). How do humans inspect BPMN models: An exploratory study. Software and Systems Modeling, 17(2), 655-673. https://doi.org/10.1007/s10270-016-0563-8

Li, W., & Toxtli, C. (2024). Automating automation: Using LLMs to generate BPMN workflows for robotic process automation. In World Congress in Computer Science, Computer Engineering, and Applied Computing (CSCE 2024) (pp. 221-229). Springer. https://doi.org/10.1007/978-3-031-86623-4_18

Object Management Group. (2011). Business Process Model and Notation (BPMN) Version 2.0. https://www.omg.org/spec/BPMN/2.0/

 

 

Creative Commons Licence

AUTHOR: Moritz Maier

Moritz Maier est professeur en tenure track pour l’analyse des processus et la numérisation à l’Institut des applications et de la sécurité des données (IDAS), rattaché au Département de technologie et d’informatique de la Haute école spécialisée bernoise (BFH).

AUTHOR: Maksym Hudinovych

Maksym Hudynovich est ingénieur logiciel à la BFH.

AUTHOR: Stefan Grösser

Stefan Grösser est professeur en sciences décisionnelles et politiques et dirige le groupe de recherche en sciences de gestion, innovation et durabilité à la BFH Technique & Informatique. Il enseigne dans le cadre du Master of Engineering (MSE) et travaille sur plusieurs projets de recherche dans les domaines de la méthodologie de simulation (dynamique des systèmes, modélisation basée sur les agents, apprentissage automatique), de la prise de décision à l'aide de l'intelligence artificielle (prise de décision et sciences de gestion) et de l'économie circulaire (économie circulaire, modèles commerciaux circulaires). Il s'intéresse en particulier aux secteurs de l'énergie solaire, de l'énergie et de la santé. Il contribue également à des publications sur les technologies d'apprentissage modernes.

Create PDF

Posts associés

Désolé, aucun article similaire n'a été trouvé.

0 réponses

Laisser un commentaire

Rejoindre la discussion?
N’hésitez pas à contribuer !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *