Was ist Ontologie überhaupt?
Wer an Tourismus denkt, bildet an erster Stelle Assoziationen mit Ferien. Wanderungen im Sommer und Herbst, Skifahren im Winter, Sehenswürdigkeiten und kulturelle Anlässe während des ganzen Jahres … alles das hat sicher in der kollektiven Vorstellung mit Tourismus zu tun.
Wenn man aber schnell bei der allgegenwärtigen Wikipedia nachschlägt und sich über «Ontologie» erkundigt (https://de.wikipedia.org/wiki/Ontologie), landet man in eine auf den ersten Blick fremde Welt. Es ist die Rede von «Einteilung des Seienden» und «Grundstrukturen der Wirklichkeit und der Möglichkeit». Wir befinden uns – oh Schreck – in der theoretischen Philosophie, in der Metaphysik. Das allein wäre für die meisten Menschen Grund genug, um diese Webseite zu verlassen und die Leitfrage dieses Artikels mit «nein» zu beantworten.
Liest man aber weiter, kommt es zu einem für Viele möglicherweise erstaunliche Angabe: «In der Informatik werden seit den 1990er Jahren formale Repräsentationssysteme, angelehnt an den philosophischen Begriff, als ‹Ontologien› bezeichnet.» Weiter unten beim Abschnitt «Verbindung zu anderen Wissenschaften» kommt die endgültige Klärung, sowie der Hinweis, warum die Informatik von «Ontologien» in Plural spricht, die Philosophie dagegen «Ontologie» nur im Singular versteht. An dieser Stelle überlasse ich gern dem Leser die weitere Lektüre dieses Wikipedia-Beitrags und vielleicht auch der weiteren Quellen in der dort aufgeführten Literatur.
Ich komme zurück auf zwei wichtige Aussagen in diesem Text:
- «Anspruch, ein allgemeingültiges Werkzeug bereitzustellen, um die Welt verstehen zu können.»
- «[…] bezieht sich der Ontologiebegriff […] auf ein begrenztes Themengebiet […].»
Wenn wir diese Aussagen in unserer Rolle als Informatiker betrachten, finden wir uns wieder. Informatik ist letzten Endes eben der Versuch, einen genau definierten Abschnitt der Welt zu verstehen, ihn mit formalen Mitteln zu modellieren und dieses Modell auf einer endlichen, realen Maschine mit begrenzten Ressourcen zum Laufen zu bringen. Dazu verwendet die Informatik Algorithmen und Datenstrukturen.
Strukturen in einer Ontologie
Wenn wir letztere als ein Begriffsnetz fassen, welches verschiedene Entitäten mit ihren Attributen und den Assoziationen untereinander darstellt, bauen wir ein semantisches Netz. Dieses beschreibt den Abschnitt der Welt, den wir technisch abbilden wollen. Fassen wir die Informationen in Form sprachlicher Aussagen mit der festen Struktur Subjekt-Verb-Objekt (SVO), sind wir daran, den ausgewählten Weltabschnitt mithilfe von semantischen Tripeln zu beschreiben.
Sprachliche Strukturen dieser Art sind aus Sicht der Logik (genauer: der Aussagen- und Prädikatenlogik erster Stufe) Aussagen, die nur einen von zwei Wahrheitswerten (tertium non datur) annehmen können. Dieser Schritt öffnet uns die Türe zur Welt der formalen Logik. Wir können die semantischen Tripeln als logische Aussagen (mit gebundenen Variablen) oder logische Prädikate (mit ungebundenen Variablen) betrachten. Diese können mithilfe von Operatoren (Junktoren) verbunden werden und komplexe logische Ausdrücke bilden.
Eine Operation ist dabei von grosser Bedeutung für den Einsatz von Ontologien in der Informatik: das Ziehen von Schlussfolgerungen. Man verwendet dabei einen Mechanismus, welcher schon Aristoteles bekannt war, den Syllogismus (Deduktion). In der modernen formalen Logik spricht man von der Implikation. Von Voraussetzungen (Prämissen) ausgehend, kommt man zu einer Schlussfolgerung (Konklusion).
Neben Fakten in Form semantischer Tripeln beinhaltet ein Ontologie-System eine Inferenzkomponente. Diese ist in der Lage, anhand der Fakten in der Wissensbasis Schlussfolgerungen nach den Regeln der formalen Logik zu ziehen. Somit können aus bestehenden Fakten explizite Informationen abgeleitet werden. Bestehendes, im Informationssystem nur implizit vorhandenes Wissen wird dank der Inferenz sichtbar gemacht. Dieser Lösungsansatz hat aber auch Grenzen. Deklaratives Wissen lässt sich elegant mit semantischen Tripeln abbilden, prozedurales und episodisches Wissen dagegen eher über Umwege oder sogar erst mit anderen Mechanismen.
Technische Umsetzung
Technisch wird die Wissensbasis der Ontologie in einem Triple Store gespeichert. Mittels einer graphbasierten Abfragesprache (SPARQL, als «sparkle» ausgesprochen, ein rekursives Akronym für «SPARQL Protocol and RDF Query Language») ist es möglich, Zugang zu dem in einem Triple Store gespeicherten deklarativen Wissen zu erlangen. Dank einer solchen Schnittstelle können Wissensbasen durch Maschinen verarbeitet werden.
Dieser Ansatz wird im semantischen Web verfolgt, dessen Grundlagen vor ungefähr zwanzig Jahren von Tim Berners-Lee beschrieben wurden. Sind die im Web gespeicherten Informationen nicht nur Menschen, sondern auch Maschinen zugänglich, kommen wir zu einem «Web of Data». Informationen können automatisch gesucht, aggregiert, angereichert, ausgewertet und mit ansprechenden Visualisierungen dargestellt werden.
Solche Lösungen verlangen wichtige Schritte, die zu OLD (Open and Linked Data) führen:
- URI zur Veröffentlichung von Informationen, nicht ganze Dokumente in unstrukturierter natürlicher Sprache
- Maschinenlesbare Verbindungen zwischen Daten (Links)
- Offene, standardisierte, maschinell lesbare Formate
- Offene, standardisierte, maschinell lesbare Metadaten zur Interpretation, Charakterisierung und Klassifizierung der Daten und der Links.
Verbindet man diese Mechanismen mit dem allgemeinen Ansatz von Ontologien, kommt man zu föderierten Systemen, deren Inhaltsangebote durch Maschinen automatisch ausgewertet werden können.
Auf dieser Basis kann man Applikationen verschiedener Art entwickeln (Auskunftssysteme, Frage-Antwort-Systeme, Decision Support Systems DSS, aktive Empfehlungssysteme, Chatbots,…).
Ontologien im Tourismus
Wie können diese Technologien einen Beitrag zur Tourismuswirtschaft leisten?
Das Internet als globaler Marktplatz bietet ein stetig wachsendes Angebot an Lösungen für Touristen. Die Spannweite reicht von einfachen Hotelbuchungen bis zu ganzheitlichen Angeboten für Pauschalreisen. Dazu kommen Metasuchmaschinen, die das Angebot mehrerer Anbieter aggregieren und die verschiedenen Lösungen für Tourismuskunden vergleichbar machen.
Die bisher verfügbaren Informationen sind aber in unterschiedlichen, meist proprietären Systemen (Datensilos) gespeichert und nur in einigen Fällen allgemein zugänglich. Die wenigen Standards und Schemata aus OLD auf diesem Fachgebiet werden zu wenig benutzt. Somit kann keine gesamthafte Sicht einer Tourismusdestination entstehen. Der Tourist als Kunde ist nicht in der Lage, sich über eine oder wenige heterogene Quellen umfassend zu informieren.
Durch ein Informationsmodell auf der Basis semantischer Technologien, welches die Begriffe im Tourismusbereich sowie ihre Eigenschaften und Beziehungen untereinander formal als Ontologie beschreibt, könnte eine gemeinsame Plattform aufgebaut werden. Diese kann die unterschiedlichen Quellen zu einem föderierten System vereinen und ihre Inhalte in strukturierter Form zugänglich machen. Diese dient dann als virtueller Informationsmarkt im Tourismusbereich. Tourismusoperatoren bieten über diese Drehscheibe Informationen an, die der Tourist als Kunde nachfragen kann. Aufgrund solcher Informationen ist er dann in der Lage, qualifizierte Entscheidungen über seine Ferien zu treffen.
Schlussfolgerung
Der Einsatz von Ontologien im Tourismusbereich könnte neue Wege für die Tourismuswirtschaft eröffnen. Ein auf nationaler Ebene koordinierter Ansatz dieser Art ist die französische Plattform «DataTourisme» (http://www.datatourisme.fr).
Das Tourismusbüro der Zukunft könnte ein System sein, das den Touristen aktiv und dynamisch umfassende, spannende Gesamtangebote unterbreiten kann. Systeme auf der Basis von Ontologien bringen uns einen Schritt weiter in diese Richtung.