Semantic Web - Quo Vadis Internet? (Teil 2 - The Giant Global Graph)

Bild des Benutzers IavorJelev

Im ersten Teil der Blogserie haben wir die Grundprinzipien des Semantic Webs kennengelernt. Doch viele Fragen sind offen geblieben. Wie hängt dieses denn eigentlich zusammen? Und was ist dieser Giant Global Graph eigentlich, von dem alle sprechen? Um diese Frage zu beantworten, lasst uns in die Vergangenheit gehen und kurz die Entwicklung des Internets (wie Tim Bereners-Lee sie in seinem Blogeintrag "Giant Global Graph" beschreibt) verfolgen.

Am Anfang gab es das noch nicht, dieses große globale Netzwerk, den wir heute das Internet nennen. Die Rechner waren stationär, und wenn dann nur mit andere in unmittelbarer Nähe verbunden. Die Revolution fing an in dem Moment, wo diese über eine Telefonleitung kommunizieren konnten. Die Daten wurden etwas freier - riesige Entferungen waren nicht mehr so relevant, und die Zusammenarbeit und Nutzbarkeit von Maschinen über Entfernungen war die Geburt vieler Online Dienste, die unser Leben vereinfacht und verbessert haben. Die Kabel, die die Verbindungen geschaffen haben, waren mittlerweile praktisch unsichtbar. Die Erkenntnis war naheliegend - "Es sind nicht die Kabel, die interessant sind, sondern die Computer, die man damit erreichen kann".

Die globale Wolke von Rechner, die nun miteinander verbunden waren, hat irgendwann den Wert der Wiederverwendung von Dokumenten erkannt. Es gab anfangs viele Skeptiker, was das globale Sharing von Informationen anging. Die Rechner waren mit einander verbunden, doch die Dokumente lagen in verschiedene Formate auf verschiedene Maschinen, und hingen nicht zusammen. Selbst als die Vision des World Wide Web (WWW) presentiert wurde und eine Programmiersprache, mit der es möglich war Dokumente miteinander zu verbinden, bereits existierte, haben sich viele gefragt: "Woher kommen denn nun die Daten, die wir verbinden sollen? Wer schreibt die existierende um? Und wer schreibt die neuen?". Irgendjemand musste das ja tun. Nach einiger Zeit exploadierte das WWW allerdings. Die technische Frage - "wie bauen wir das globale Netzwerk von Daten" war eigentlich der falsche Ansatz. Die eigentliche Frage war gewesen - was für Tools brauchen die Menschen, um das WWW selbst zu bauen. Genau diese hat Tim Berners-Lee visioniert und es schien zu funktionieren. Eine Unmenge an Dokumente wurden erstellt und von andere Leute gefunden und wiederverwendet. Oft wurden sie sogag ganz anders verwendet als ursprünglich vom Autor gedacht. Die Erkenntnis war naheliegend - "Es sind nicht die Computer, die interessant sind, es sind die Dokumente, die man dort finden kann".

Das WWW existiert nun eine ganze Weile, und wir kommen täglich in dem Genuss es zu nutzen. Dokumente gibt es mittlerweile so viele, dass die spezielle Information, die man braucht, nicht immer in einem liegt, sondern aus verschiedene extrahiert und zusammengefasst werden muss. Mit Web 2.0 sind auch Video- und Audiodateien dazugekommen. Nun kommt das Problem der maschinellen Erfassung. Computer können zwar die Verbindungen zwischen den Dokumenten verfolgen, doch diese zu interpretieren und Informationen daraus zu extrahieren ist nicht immer einfach oder gar möglich. Wie wir im letzten Blogeintrag geshen haben, ist das genau der Punkt an dem die Semantic Web Bewegung ansetzen will. Die Erkenntnis ist naheliegend - "Es sind nicht die Dokumente, die interessant sind, sondern die Informationen, die man dort findet". Diese Informationen in Form von Konzepte von den Dokumenten zu lösen und mit einander zu verbinden, ist die Ideologie hinter dem, was wir the Giant Global Graph (oder auch Linked Data) nennen.

Giant Global Graph hört sich vermutlich so kompliziert an, so kryptisch. Das liegt meiner Meinung nach nur daran, dass wir einen "unbekannten" Begriff verwenden um etwas zu beschreiben, was eigentlich schon bekannt ist, wodurch das Ganze "unbekannt" klingt. Die Soziale Netzwerke, die heutzutage so populär sind (z.B. Facebook), sind eigentlich genau das - ein gigantischer Graph von zusammenhängender Konzepte (Menschen, Produkte, Orte, etc). Sie nennen es "Open Graph". Und auch hier - die Platform selbst (die Seite) ist nicht das relevante, sondern die darunterliegende Konzepte, nämlich das soziale Netzwerk selbst.

Am Ende des letzten Blogeintrages wurde ein Beispiel für eine Ausprägung dieser miteinander verbundenen Konzepte angedeutet - "Wie kommt der Algorithmus darauf bei der Buchung ihres Wanderurlaubs Ihnen Pflaster zu empfehlen?". Die Beschreibung der dahinterliegenden Konzepte und deren Teilnahme in einem Netzwerk von Daten macht es möglich. Nehmen wir an die Seite auf der man den Wanderurlaub bucht, verlinkt unter Anderem auf eine andere, welche die häufigsten damit verbundenen Beschwerden abbildet. Diese wiederrum verlinkt auf eine Apotheken Seite, die die passenden Produkte anbietet, um diese zu behandeln. Das ist klassisches Web 2.0 - miteinander verbundene Dokumente. Sehr leicht verständlich für einen Menschen, doch nicht für Maschinen. Es ist zwar nicht unmöglich einen Algorithmus zu entwickeln, der diese Dokumente interpretiert, doch ohne Vorgabe wie die dort vorgefundene Informationen zusammenhängen, ist es schwierig oder unmöglich für eine Maschine mit den Erkenntnissen was anzufangen. Im Web 3.0 sind die Daten mit einander verbunden (also die Konzepte verlinken auf einander, nicht die Dokumente). Das Konzept Wanderurlaub würde unter Anderem auf diverse Beschwerden verlinken, die damit zusammenhängen könnten. Jede Beschwerde selbst würde auf ein oder mehrere Produkte in der Apotheken Ontologie verlinken, die diese behandeln, oder vorbeugen können. Somit ist für einen Computer sehr einfach herauszufinden, dass die häufigste Beschwerde, die mit Wandern verbunden wird, Blasen an den Füssen ist, um Ihnen im nächsten Schritt Pflaster (oder Salben) zur Behandlung dieser zu empfehlen.

Zusammengefasst haben wir gesehen, dass der gigantische globale Graph die nächste Stufe in der Evolution des WWW ist, wo nicht mehr Dokumente, sondern die darin verborgene Konzepte aufeinander verlinken. Die ersten 2 Einträge dieser Blogserie über dem Semantic Web haben sehr viel Theorie abgedeckt, doch wie sieht es in der Praxis aus? Es hört sich doch so an, als würde eine semantische Applikation Informationen, die auf verschiedene Seiten liegen, für mich zusammengefasst auf eine präsentieren? Richtig. Und den Aufbau einer solchen Applikation würden wir uns im nächsten Blogeintrag anschauen. Bis dahin eine schöne Woche noch, und soltet ihr Wanderurlaub machen - Pflaster nicht vergessen ;-)