Semantic Web - Quo Vadis Internet? (Teil 1 - Was ist Semantic Web)
Das Semantic Web ist ein immer öfter besprochenes Thema. Einige sehen darin die Zukunft des Internets, das so genannte Web 3.0. Andere halten es für viel zu kompliziert, ungenau und nicht performant genug. Wie bei viele Diskussionen liegt die Wahrheit vermutlich irgendwo dazwischen, doch in diesen Blogeintrag wollen wir andere Fragen näher beleuchten und beantworten, nämlich was ist Semantic Web, was bringt es und wieso sollte ich sofort einsteigen.
Das Semantic Web ist eine Vision vom "Vater" des WWW selbst - Tim Berners-Lee. Er beschreibt dieses als ein "Netz von Daten, die direkt und indirekt von Maschinen verarbeitet werden können". Diese Vision hat vermutlich ihren Ursprung in der Problematik des Informationsüberflusses, dem wir heute im WWW ausgesetzt sind. Es existieren Informationen zu ziemlich jedes erdenkliche Thema, doch diese zu durchsuchen und miteinander auf eine sinnvolle Art und Weise zu verknüpfen wird immer schwieriger. Als Beispiel liefern Anfragen bei Google über bekannte Firmen wie "Apple" oder "Microsoft" hunderte von Millionen bis Milliarden von Ergebnissen. Die alle durchzulesen ist für einen Menschen unzumutbar. Also brauchen wir ein Automatismus (also Maschinen), die uns diese Aufgabe abnehmen.
Die maschinelle Erfassung von Texte und Daten (Audio, Video, etc.) ist ein langjähriger Forschungsgebiet, und kein einfacher. Das Problem fängt schon da an, dass das geschiebene Wort für ein Rechner lediglich eine Bitfolge ist. Wir denken jedoch nicht in Buchstaben, sondern Konzepte. Für ein Mensch ist es zum Beispiel sehr leicht zu verstehen, dass "Peter Müller" eine Person ist. Somit ist "Müller" ein Nachname und nicht die Firma "Müller". Für eine Maschine dagegen ist es eine identische Bitfolge, und hat somit die gleiche Bedeutung. Darin verbirgt sich der größte Problem der Volltextsuche, nämlich die Konzepte auseinanderzuhalten, die mit der gesuchten Wortfolge gemeint sind. Wie oft müssen Sie sich durch die Ergbnisliste von Google klicken, bis Sie das gefunden haben, was Sie eigentlich meinten?
Wie kann man also diesen Problem lösen? Nun, es gibt zwei intuitive Ansätze - entweder wir bauen "schauere" Maschinen, oder wir erstellen "schlauere" Daten. Der zweite ist der Weg vom Semantic Web. Dieser ergänzt Dokumente mit den dazugehörigen Metadaten, die bestimmte Wörter (oder Wortfolgen), die darin vorkommen, mit den damit gemeinten Konzepten verknüpft. Dadurch wird der Dokument sowohl für Menschen, als auch für Maschinen verständlich. In unserem obigen Beispiel würde man in den Metadaten zu "Peter Müller" angeben, dass das eine Person ist, und in diesen für "Müller", die Firma, dass es ein Unternehmen ist. Nun ist eine Maschine sehr leicht in der Lage diese identischen Bitfolgen, nämlich "Müller" auseinander zu halten. Allein das ist ein mächtiges Werkzeug für Suchoptimierung, doch das ist nur der Anfang.
Wir sehen also, dass das Semantic Web kein neues Web ist, sondern eine Erweiterung des Existierenden. Es befolgt unter Anderem folgende Prinzipien:
- Klare Definitionen. Die Daten im Semantic Web haben eine klar vorgegebene Bedeutung. Definitionen von diverse Konzepte in Form von Schemas und Ontologien, erleichtern das maschinelle "Verständnis" der existierenden Daten.
- Verfügbar und leicht zu finden. Die Daten sind offen, und nicht mehrfach in diverse geschlossene Datenbanken hinterlegt, was zu große Ambiguität führt. Durch deren Wiederverwendung werden die Verbindungen zwischen den einzelnen Konzepte erschaffen und gefestigt. Was uns zum nächsten Punkt führt.
- Wiederverwendung. Bereits existierenden Schemas und Daten können und sollen wiederverwendet werden. Das transformiert unsere Daten in kleine Legobausteine, die man miteinander Verknüpfen kann. Somit muss man nur an eine Stelle was ändern, damit es überall wo es vorkommt sofort aktualisiert wird.
- Zusammenarbeitsfähigkeit. Durch die klare Definitionen der Daten ist die Interoperabilität der Maschinen leichter. Sie wohnen in Deutschland und wollen ein Hotelzimmer in Südamerika für eine Reise buchen, was nicht mehr als 20 € pro Nacht kostet? Kein Problem für ein Suchalgoritmus im Semantic Web, der das Konzept "Preis" kennt. Die Währungen für jedes Land in Frage werden automatisch mit dem aktuellen Kurs umgerechnet und mit den jeweiligen Hotel Preisen verglichen. Sie kriegen eine übersichtliche Liste nach Land sortiert zurück.
- Flexibilität. Im Unterschied zu Datenbanken ist die Anpassung einer Schema im Semantic Web kinderleicht. Das macht es dynamisch und flexibel. Stand heute geben viele größere Unternehmen 80% Ihres IT Budgets für die Verwaltung ihrer Daten aus. Neue, leichtere Methoden mit den Daten umzugehen werden häufig nicht übernommen, da die Anpassung der darunterliegenden Struktur und die Portierung der Daten darauf viel zu teuer ist.
- Geschwindigkeit. Dadurch das die Daten miteinander verbunden und von Maschinen verständlich sind, sind Änderungen und wichtige Ereignisse sowie Ihre Auswirkungen sofort sichtbar. Heutzutage müssen diese manuel von Menschen eingepflegt werden. Die dadurch entstehenden Verzögerungen können in einigen Fällen richtig teuer werden.
Noch nicht zum Mitmachen motiviert? Wussten Sie schon, dass die Suchmaschinen Bing (Microsoft), Google und Yahoo mit schema.org eine ziemlich Umfangreiche semantische Schema erstellt haben, die sie nutzen werden um Ihre Suchergebnisse zu optimieren? Webseiten, die ihre Texte mit Metadaten anreichern, die dieses Schema nutzen, werden bereits auf die Ergebnisseite damit angereichert. Stellen Sie sich vor, dass Sie ein Mobiltelefon Shop betreiben. Ihre Suchmaschinenoptimierung ist gut, und bei der Suche eines Handymodells, den Sie verkaufen, taucht Ihre Seite an erster Stelle auf. Doch der drittplazierte hat seine Seite mit Metadaten angereichert, und dessen Suchergebnis hat ein Bild von dem ensprechenden Handy, der Preis, und Benutzerbewertungen bereits dort aufgelistet. Als Suchender- auf welchen Link würden Sie klicken?
Zusammenfassend haben wir gesehen, dass das Semantic Web eine Erweiterung des Existierenden ist, sowie an Anerkennung gewinnt. Wir haben dessen Vision kennengelernt und einigen der Strukturen dahinter, sowie wieso es wichtig ist bereits jetzt darüber nachzudenken mitzumachen. Im nächsten Teil dieser Blogserie werden wir den Gigantischen Graph von Daten kennenlernen und wie uns dieser erlaubt die verfügbaren Daten auf eine sinnvolle Art und Weise miteinander zu verknüpfen. Wie kommt der Algorithmus darauf bei der Buchung ihres Wanderurlaubs Ihnen Pflaster zu empfehlen? Ganz leicht :-), doch mehr darüber in Teil 2 - The Giant Global Graph. Bis dahin wünsche ich Euch eine schöne Woche!
- Blog von IavorJelev
- Zum Verfassen von Kommentaren bitte Anmelden oder Registrieren.