Données de mobilité synthétiques : l’avenir de la planification urbaine intelligente
Les villes intelligentes, l’optimisation du trafic et les véhicules autonomes reposent tous sur une ressource essentielle : les données de mobilité. Mais comment exploiter ce potentiel tout en protégeant la vie privée ? Les données de mobilité synthétiques offrent une solution prometteuse en générant des schémas de déplacement artificiels mais statistiquement fiables, sans suivre les individus réels. Notre équipe de recherche à la BFH explore le potentiel et les défis de cette technologie transformative.
Que sont les données de mobilité synthétiques ?
Les données synthétiques sont des données générées artificiellement, non obtenues par la collecte directe d’événements réels, de processus, de déplacements ou de localisations de personnes. Ces données produites sont créées à l’aide d’algorithmes et de modèles partiellement génératifs simulés. Pourquoi en avons-nous besoin ? Parce que l’utilisation de données synthétiques est particulièrement précieuse lorsqu’il s’agit de données sensibles, notamment pour garantir la protection de la vie privée et répondre à d’autres exigences de sécurité.
Cas d’usage à travers le monde
Les données de mobilité synthétiques ont déjà démontré leur utilité à l’échelle mondiale.
- Singapour : pour la planification urbaine, l’analyse des flux de circulation et des déplacements piétons
- Amsterdam et Copenhague : pour l’optimisation des réseaux de pistes cyclables
- Londres et New York : pour l’amélioration des horaires et des itinéraires des transports publics
- Barcelone et Séoul : pour la mise en œuvre du concept de « ville intelligente », ainsi que par des entreprises comme Waymo et Tesla pour le développement et les tests de véhicules autonomes
- Villes suisses : à Zurich et à Genève, les données de mobilité synthétiques peuvent être utilisées pour la gestion du trafic, contribuant à réduire les embouteillages, à améliorer la fluidité des déplacements, à optimiser la synchronisation des feux de circulation, et à concevoir et planifier des nœuds de transport, entre autres.
Le défi de l’équilibre
Les données synthétiques ne doivent contenir aucune information relative à des personnes réelles ni à leur comportement. Cependant, elles doivent simultanément être suffisamment informatives pour répondre aux paramètres spécifiés de la demande. C’est là tout le défi — et l’avantage — de la production de données synthétiques : des données synthétiques de haute qualité doivent être statistiquement indiscernables des données réelles. C’est pourquoi une attention particulière est portée, lors de leur génération, à la prévention des biais dans les algorithmes et les modèles utilisés.
Éviter les biais potentiels
Ces données représentent une simplification des données réelles ; il est donc essentiel de préserver l’informativité des indicateurs clés. La génération de données de mobilité synthétiques peut être sujette à des erreurs systématiques, algorithmiques, historiques, démographiques, géographiques, techniques ou temporelles. Pour éviter ces biais potentiels, il convient de garantir une représentation pertinente des groupes d’âge et des origines ethniques, des régions géographiques, ainsi que de tenir compte des différents schémas de déplacement et des divers modes de transport, des fluctuations saisonnières et quotidiennes de l’intensité du trafic, et des spécificités des zones urbaines et rurales.
Les données de mobilité synthétiques fournissent des informations sur les localisations, la direction, la vitesse et les horaires des déplacements de population, sans aucune corrélation avec des individus réels. Les algorithmes ou modèles de simulation utilisés pour produire ces données intègrent des facteurs tels que les schémas de déplacement typiques, les nœuds de transport, les horaires des transports publics, la densité de population, entre autres.
Techniques de génération diverses
L’utilisation des données de mobilité synthétiques offre la possibilité de tester des scénarios contrôlés de changements planifiés, tels que la capacité à prévoir les modifications du trafic urbain et de la mobilité des personnes en lien avec l’optimisation des transports publics. Il va sans dire que parvenir à une telle précision prédictive est extrêmement complexe, le comportement humain étant influencé par de nombreux facteurs difficiles à anticiper et à structurer dans un schéma algorithmique.
Parmi les techniques actuellement reconnues pour la création de données synthétiques, on peut citer :
- La modélisation basée sur les agents (ABM) : simulation des actions d’agents individuels représentant un environnement ou une communauté
- Les simulations de Monte Carlo et les modèles de Markov : tentatives de prévision des probabilités dynamiques d’un système à partir d’indicateurs connus
- Les algorithmes d’apprentissage automatique : génération de données synthétiques imitant les indicateurs clés des données réelles
- L’analyse de réseaux : modélisation des modifications du système sous l’effet d’un nouveau facteur d’influence
- Les modèles de microsimulation : modélisation des unités individuelles (par exemple, les déplacements des cyclistes) pour prédire leurs interactions à petite échelle (quartier, ville)
- Les automates cellulaires : modélisation des microdonnées en tenant compte d’un contexte d’analyse plus large
- L’extrapolation statistique : utilisation de méthodes statistiques pour élaborer des scénarios de changements potentiels.
Défis et limitations
La création de données de mobilité synthétiques comporte plusieurs difficultés. Ces données reposent sur des facteurs et des schémas statistiques, et doivent être capables d’intégrer des circonstances exceptionnelles telles que les conditions météorologiques, les événements spéciaux, les travaux routiers ou divers facteurs sociaux. Leur nature artificielle exige une validation par comparaison avec des données réelles afin d’en confirmer la qualité et l’informativité. La génération de données de mobilité synthétiques de haute qualité est également très gourmande en ressources, en particulier dans le cadre des modèles de simulation basés sur les agents. En outre, ces données peuvent rapidement perdre de leur pertinence face à la dynamique du monde réel : évolution démographique, introduction d’innovations, nouvelles législations, projets d’urbanisme, épidémies, diversification des moyens de transport, etc.
Applications potentielles
Au-delà de la protection de la vie privée et de l’efficacité dans la création de scénarios de changement, les données de mobilité synthétiques jouent un rôle clé dans la prise de décision en matière d’allocation des ressources — par exemple, pour déterminer où construire de nouvelles routes, implanter des services ou optimiser les réseaux de transport public. Ces données sont également essentielles pour des technologies telles que les véhicules autonomes, en fournissant un environnement sûr pour leur développement et leurs essais, ainsi que pour mener divers types de recherches et déployer des innovations en toute sécurité. À terme, l’utilisation des données de mobilité synthétiques permettra potentiellement de réaliser des économies en réduisant le besoin de vastes campagnes de collecte de données réelles.
Projets associés
https://www.bfh.ch/de/forschung/forschungsprojekte/2022-470-842-714/

Laisser un commentaire
Rejoindre la discussion?N’hésitez pas à contribuer !