Synthetische Mobilitätsdaten: Die Zukunft der intelligenten Stadtplanung
Intelligente Städte, optimierter Verkehr und autonome Fahrzeuge hängen alle von einer entscheidenden Ressource ab: Mobilitätsdaten. Doch wie können wir diese Kraft nutzen und gleichzeitig die Privatsphäre schützen? Synthetische Mobilitätsdaten bieten eine überzeugende Lösung, indem sie künstliche, aber statistisch genaue Bewegungsmuster erzeugen, ohne die Daten realer Personen offenzulegen. Unser Forschungsteam an der Berner Fachhochschule untersucht das Potenzial und die Herausforderungen dieser transformativen Technologie.
Was sind synthetische Mobilitätsdaten?
Synthetische Daten sind künstlich erzeugte Daten, die nicht durch die direkte Erfassung realer Ereignisse, Prozesse, Bewegungsmuster oder Standorte von Personen gewonnen werden. Diese Daten werden mithilfe von Algorithmen, Simulationen und teilweise generativen Modellen erstellt. Warum benötigen wir sie? Die Verwendung synthetischer Daten ist besonders wertvoll im Umgang mit sensiblen personenbezogenen Daten, da sie den Schutz der Privatsphäre und die Einhaltung anderer Sicherheitsanforderungen ermöglichen.
Anwendungsfälle weltweit
Synthetische Mobilitätsdaten haben ihren Wert weltweit bereits unter Beweis gestellt.
- Singapur: Für Stadtplanung, Verständnis von Verkehrsmustern und Fussgängerströmen
- Amsterdam und Kopenhagen: Für die Optimierung von Fahrradroutennetzen
- London und New York: Für die Optimierung von Fahrplänen und Routen des öffentlichen Nahverkehrs
- Barcelona und Seoul: Für die Umsetzung des «Smart City»-Konzepts, sowie von Unternehmen wie Waymo und Tesla für die Entwicklung und Erprobung autonomer Fahrzeuge
- Schweizer Städte: In Zürich und Genf können synthetische Mobilitätsdaten für das Verkehrsmanagement eingesetzt werden, um Staus zu reduzieren und den Verkehrsfluss zu verbessern, Ampelschaltungen zu optimieren, Verkehrsknotenpunkte zu gestalten und zu planen, usw.
Ein Balanceakt
Synthetische Daten sollten keine Informationen über reale Personen und deren Verhalten enthalten, gleichzeitig aber entsprechend der spezifizierten Parameter der Anforderung aussagekräftig genug sein. Dies ist die zentrale Herausforderung und zugleich der Vorteil bei der Erzeugung synthetischer Daten: Hochwertige synthetische Daten sollten hinsichtlich ihrer statistischen Eigenschaften von realen Daten nicht zu unterscheiden sein. Daher wird bei der Generierung synthetischer Daten ein besonderes Augenmerk darauf gelegt, Verzerrungen in den Algorithmen und Modellen ihrer Erstellung zu verhindern.
Vermeidung potenzieller Verzerrungen
Solche Daten sind eine Vereinfachung realer Daten, daher ist es wichtig, die Aussagekraft der Schlüsselindikatoren zu bewahren. Bei der Generierung synthetischer Mobilitätsdaten können systematische, algorithmische, demografische, geografische, technische und zeitliche Fehler auftreten. Um potenzielle Verzerrungen bei der Erzeugung synthetischer Daten zu vermeiden, sind mehrere Faktoren zu berücksichtigen: die angemessene Repräsentation verschiedener Alters- und ethnischer Gruppen, die Einbeziehung unterschiedlicher geografischer Regionen, die Abbildung vielfältiger Bewegungsmuster und Verkehrsmittel. Zudem müssen saisonale und tägliche Schwankungen der Verkehrsintensität sowie die Besonderheiten von Stadt- und Landgebieten einbezogen werden.
Synthetische Mobilitätsdaten liefern Informationen über Standorte, Richtung, Geschwindigkeit und Zeitpunkt der Bevölkerungsbewegung ohne jegliche Verbindung zu realen Personen. Die zur Erstellung synthetischer Daten verwendeten Algorithmen oder Simulationsmodelle berücksichtigen Faktoren wie typische Bewegungsmuster, Verkehrsknotenpunkte, Fahrpläne des öffentlichen Nahverkehrs, Bevölkerungsdichte usw.
Vielfältige Generierungstechniken
Die Verwendung synthetischer Mobilitätsdaten bietet die Möglichkeit, kontrollierte Szenarien geplanter Veränderungen zu testen, wie etwa die Fähigkeit, Veränderungen im städtischen Verkehr und in der Mobilität von Menschen im Zusammenhang mit der Optimierung des öffentlichen Nahverkehrs vorherzusagen. Zweifellos ist es äusserst schwierig, bei einer solchen Prognose hohe Genauigkeit zu erreichen, da menschliches Verhalten von vielen Faktoren bestimmt wird, die schwer vorherzusehen und in ein algorithmisches Schema zu strukturieren sind.
Derzeit bekannte Techniken zur Erstellung synthetischer Daten umfassen:
- Agent-Based Modeling (ABM) – Simulation der Handlungen einzelner Agenten als Vertreter einer Umgebung oder Gemeinschaft,
- Monte-Carlo-Simulationen und Markov-Modelle – Versuche, potenzielle Wahrscheinlichkeiten der Systemdynamik auf Basis bekannter Indikatoren vorherzusagen,
- Maschinelles Lernen – Erstellung synthetischer Daten, die Schlüsselindikatoren realer Daten nachahmen,
- Netzwerkanalyse – Modellierung von Systemveränderungen basierend auf dem Einfluss eines neuen wirksamen Faktors,
- Mikrosimulationsmodelle – Modellierung einzelner Einheiten (zum Beispiel Bewegungen von Radfahrern), um ihre Interaktion im kleinen Maßstab (Stadtteil, Stadt) vorherzusagen,
- Zelluläre Automaten – Modellierung von Mikrodaten unter Berücksichtigung eines größeren Kontextes möglicher Analysen,
- Statistische Extrapolation – Verwendung statistischer Methoden zur Entwicklung von Szenarien potenzieller Veränderungen.
Herausforderungen und Einschränkungen
Bei der Erstellung synthetischer Mobilitätsdaten gibt es eine Reihe von Schwierigkeiten. Sie basieren auf statistischen Faktoren und Mustern und können höhere Gewalt wie Wetterbedingungen, besondere Ereignisse, Strassenarbeiten und verschiedene soziale Faktoren einbeziehen. Ihre künstliche Natur erfordert eine Verifizierung mit realen Daten, um ihre Qualität und Aussagekraft zu bestätigen. Die Generierung qualitativ hochwertiger synthetischer Mobilitätsdaten ist sehr ressourcenintensiv, besonders bei agentenbasierten Modellierungsansätzen. Darüber hinaus können synthetische Daten aufgrund der Dynamik der realen Welt schnell an Relevanz verlieren: Bevölkerungsveränderungen, die Einführung von Innovationen, neue Gesetze, Stadtplanung, Epidemien, die Nutzung verschiedener Verkehrsmittel usw.
Potenzielle Anwendungen
Neben dem Schutz der Privatsphäre und der effizienten Erstellung von Szenarien für Veränderungen sind synthetische Mobilitätsdaten wichtig für Entscheidungen über die Ressourcenzuweisung, beispielsweise wo neue Strassen gebaut, Dienstleistungen angesiedelt oder der öffentliche Nahverkehr optimiert werden sollten. Diese Daten sind für Technologien wie autonome Fahrzeuge von Bedeutung, da sie eine sichere Umgebung für Entwicklung und Tests bieten, sowie für die Durchführung verschiedener Arten von Forschung und die sichere Implementierung von Innovationen. Potenziell wird die Verwendung synthetischer Mobilitätsdaten Ressourcen sparen, indem sie die Notwendigkeit umfangreicher Kampagnen zur Sammlung realer Daten reduziert.
Link zum BFH-Forschungsprojekt
https://www.bfh.ch/de/forschung/forschungsprojekte/2022-470-842-714/

Dein Kommentar
An Diskussion beteiligen?Hinterlasse uns Deinen Kommentar!