Unternehmensgerechte Internet-Suche
Das semantische Web hat noch einen langen Weg vor sich
Trotz einer Vielzahl guter Vorsätze und Ideen läuft eine pfiffige Volltextsuche der intelligenteren RDF-Technologie, die gerade für Unternehmen zeitsparend wäre, noch immer den Rang ab.
Google Custom Search eine gute Lösung?
Unternehmensgerechte Internet-Suche
Die neue Suchmaschine von Google, genannt “Custom Search Engine“, zielt darauf ab, die Relevanz der Sucherergebnisse zu verbessern – und soll gleichzeitig mehr Nutzer anlocken. Die Nutzer können damit eigene Suchmaschinen entwickeln, die auf ein spezielles Thema ausgerichtet sind und die Ergebnisse auf eine Liste von spezifizierten Webseiten begrenzen oder aber bestimmten Seiten Priorität einräumen.
Sie können bestimmte Seiten auch mit Anmerkungen versehen, mit anderen Personen zusammenarbeiten, um eine Feinabstimmung der Liste vorzunehmen, und die Einkünfte aus kontextsensitiver Werbung in den Suchergebnissen teilen. Ein weiterer Gedanke ist, dass Unternehmen dies als Suchmaschine für ihre eigenen Webseiten nutzen können.
Dieses Konzept hilft bei der Lösung von zwei Kernproblemen der Suche.
Da wäre einmal die Vieldeutigkeit. Sucht man beispielsweise nach WPF, kann man Ergebnisse sowohl für die “World Puzzle Federation” als auch für “Windows Presentation Foundation” erhalten. Suche ich nach letzterem, wird eine Suchmaschine, die auf Programmierung spezialisiert ist, dies auch finden. Das zweite Problem ist, dass im Web Millionen von “Blindseiten” oder Blogs kursieren, die einzig darauf ausgerichtet sind, von Klicks auf Werbeanzeigen zu profitieren. Eine maßgeschneiderte Weiße Liste kann das verhindern.
Semantik als bessere Antwort
Unternehmensgerechte Internet-Suche
Die Kehrseite ist der Zeitaufwand, um die richtige spezialisierte Suchmaschine zu finden. Einige von uns ziehen es vor, einfach die Wörter in Google einzugeben, auf Suche zu klicken und sich mit ein paar unerheblichen Ergebnissen zufrieden zu geben. Eine spezialisierte Suchmaschine ist bestenfalls eine Möglichkeit, die Ergebnisse zu filtern.
Theoretisch ist das semantische Web die bessere Antwort auf das Rätselraten bei den Suchaktivitäten. Damit hat eine Webseite oder eine Online-Datenbank die Möglichkeit, ihren Inhalt mittels RDF (Resource Description Framework) zu beschreiben und ihre Ressourcen, Eigenschaften und andere Aussagen eindeutig zu identifizieren.
Das Forschungslabor von HP stellt die Vorzüge von RDF in den schillerndsten Farben dar und verweist auf die mehr als 125 000 Downloads seiner kostenlosen “Jena-Bibliothek” für RDF-Anwendungen (hier auf der OpenSource-Site SourceForge als Download). Martin Merry, Forschungsleiter für das semantische Web im HP-Labor, erläuterte: “Wir versuchen, das semantische Web lebensfähig zu machen. Es gab einfach Nichts für Leute, die mit dieser Technologie experimentieren wollten.”
Aber selbst Merry gibt zu, dass das semantische Web noch in den Kinderschuhen steckt. RDF wird noch immer eher “als eine spezialisierte Suchform innerhalb von Unternehmen verwendet”, meinte er.
Unternehmen nehmen RDF eher zögertlich an
Unternehmensgerechte Internet-Suche
Ein echtes semantisches Web wäre wesentlich mächtiger als das heutige Internet, nicht nur für die Suche, sondern auch für die Integration and Aggregation von Daten.
Web-Erfinder Tim berners-Lee erklärte bereits im Dezember 2000, wie RDF und Semantik das Web verbessern könnten.
Tm Berners Lee erklärt das symantische Web schon auf der XML-Konferenz 2000. Bild: W3C
Aber Google lehrt uns, dass schlaue Algorithmen zur Verbesserung der einfachen Textsuche mehr ausrichten als Versuche, semantische Dokumenten-Auszeichnungen einzuführen.
Der begrenzte Fortschritt, der bisher erreicht wurde, liegt eher bei Consumer-Aktionen wie im Tagging des Web 2.0, bei Microformaten und bei RSS, das eigentlich ein Dialekt von RDF ist. Die Bemühungen, Unternehmen zu überzeugen, RDF-Daten zu veröffentlichen, liegen bisher brach. Vor dem semantischen Web, das den Unternehmen mehr bringen könnte, liegt also noch ein langer Weg.