Netzwelt erklärt, was hinter dem Semantic Web und dem RDF-Standard steckt

Netzwelt-Wissen: RDF - Struktur und Semantik im World Wide Web

Das WorldWideWeb ist eine geniale Erfindung: Über offene Protokolle und Technologien, die an keine Firma oder eine einzige Anwendung gekoppelt sind, kann jeder Mensch oder ein beliebiges Unternehmen an dem globale Netzwerk teilhaben. Dabei geschieht das Ablegen von Informationen bewusst unstrukturiert: Sobald Inhalte für einen anderen Teilnehmer interessant sind, setzt er einfach einen Hyperlink darauf. Seit mehr als zwanzig Jahren bestimmt das Web als fehlertolerantes System zur Veröffentlichung von Inhalten beliebiger Art die Landschaft der Dienste im Internet - und wird in der Popularität nur von der E-Mail geschlagen.

Semantic Web - RDF ist ein bedeutender Bestandteil der Initiative zum "Semantic Web" des W3C.
RDF ist ein bedeutender Bestandteil der Initiative zum "Semantic Web" des W3C.

Inhaltsverzeichnis

  1. 1Semantisches Netz
  2. 2Sir Tim Berners-Lee
  3. 3RDF: Basis des Web
  4. 4XML und N3-Notation
  5. 5Praxis: Was nützt es?
  6. 6Die nächsten Schritte
  7. 7Fazit

Die größte Stärke des Web ist aber gleichzeitig auch seine größte Schwäche: Da Inhalte ohne jede Struktur abgelegt werden können, wird das Web mit zunehmender Größe immer unübersichtlicher. Suchmaschinen versuchen zwar Ordnung in das kreative Chaos zu bringen - doch sie verstehen nicht wirklich die Bedeutung der Inhalte in Text und Bild, die angeboten werden. Nachdem durch Standards, etwa HTTP und HTML, das Web grundlegend aufgebaut wurde, beschäftigen sich die großen IT-Konzerne sowie die Organisation W3C nun immer intensiver damit, wie man mehr Ordnung ins WorldWideWeb bringt.

Werbung

Semantisches Netz

Die Bezeichnung "Semantic Web" gibt es noch nicht sehr lange und ist eine Ableitung von den sogenannten semantischen Netzen, die im Bereich der IT-Forschung zur Anwendung kommen. Was kompliziert klingt, ist eigentlich ganz einfach: Ein semantisches Netz ist eine wirre Ansammlung von Begriffen oder Phrasen, die über Relationen miteinander verbunden werden und sich so gegenseitig Bedeutung verleihen. So kann der Begriff "Netzwelt" mit "Magazin" über die Relation "ist ein" verbunden werden. Die eigentliche Qualität eines semantischen Netzes liegt nicht in der Aufsplitterung von Ausgangsdaten in möglichst sinnvolle Konten, sehr wohl aber in der Unterscheidung von Relationstypen sowie deren vollautomatischer Verarbeitung.

Bei den Relationstypen selbst sind dutzende Kategorien denkbar, die den Zusammenhang zweier Knoten in mehr oder weniger genauer Weise beschreiben: So gehören zu den hierarchischen Relationen nicht nur die Verwerbungs- und Instanzrelation, sondern auch Synonyme. Mittels der sogenannten Antonyme kann durch eine Beziehung ausgedrückt werden, dass zwei Knoten genau gegensätzliche Bedeutung haben, etwa wie die Begriffe "Leben" und "Sterben". Hier ist es aber zum Beispiel schwierig, das Verhältnis etwa der Farben Schwarz und Weiß in einem semantischen Netz wirklich genau zu kennzeichnen: Je nach Kontext bilden sie einen Gegensatz, dann aber wieder nicht. Mit Kausationen und Eigenschaften, mittels derer Substantive und Adjektive verbunden werden können, lässt sich ein semantisches Netz noch weiter spinnen.

In der Regel wird ein semantisches Netz heute technisch als Graph realisiert, was wirklich keine allzu große technische Herausforderung mehr darstellt. Dagegen ist es aber immernoch sehr schwer, überhaupt einmal die Grundlagen für die Einträge in sozialen Netzen zu erkennen: Das Natural Language Processing, also die Verarbeitung natürlicher Sprache und deren Bedeutung, kümmert sich ganz genau darum.

Links zum Thema

Kommentieren