Tag-Clouds aus Design- und Usability-Sicht
Wortwolken am Webhimmel

Allgemein

Das Web 2.0 hat nicht nur leere Marketingphrasen hervorgebracht, sondern in Sachen Design auch einiges bewirkt. Eines der interessantesten Phänomene sind die Tag-Clouds.

Wortwolken

Tag-Clouds aus Design- und Usability-Sicht

Tag-Clouds bestehen aus verschiedenen Links, die Begriffe oder sonstige Informationen gemäß ihrer Häufigkeit auffälliger oder weniger auffällig hervorheben. Der deutsche Begriff Wortwolken trifft dabei nur einen Teil der möglichen Funktionalität von Tag-Clouds. Ein Tag ist nicht nur ein Wort, sondern eine Art Etikett für eine bestimmte Art von Inhalt. Nicht umsonst wird hier derselbe Begriff verwendet wie für einen HTML-Befehl. Auch die HTML-Tags waren ursprünglich zur logischen Auszeichnung gedacht und haben ihre Formatierwirkung erst nach und nach erhalten ? und verlieren sie dank CSS auch wieder.

Wer die erste Tag-Cloud eingesetzt hat, ist schwer festzustellen. Das erste bekannte Beispiel war die Bildertauschsite Flickr, die dazu ein Werkzeug namens Zeitgeist von Jim Flanagan eingesetzt hat. Zeitgeist ist übrigens auch der von Google verwendete Name für die regelmäßige Auflistung der populärsten Suchwörter (www.google.com/press/zeitgeist.html). Dass Tag-Clouds ausgerechnet mit Bilderverschlagwortung gestartet wurden, ist natürlich kein Zufall. Denn hier handelt es sich um Inhalte, die für sich allein nicht durchsuchbar sind und insofern unbedingt passende Begriffe zugeordnet haben müssen.


Logik und Gewichtung

Tag-Clouds aus Design- und Usability-Sicht

Allen Tag-Clouds ist gemein, dass ein oder mehrere Kriterien dazu verwendet werden, Begriffe optisch zu gewichten. Die Logik, sprich: welche Kriterien verwendet werden, kann aber sehr unterschiedlich sein. Tag-Clouds können Suchbegriffe aus dem HTTP-Referrer oder dem Log einer Site-internen Suchmaschine ziehen. Sie können aber auch Texte analysieren und Wörter gewichten. Für Blogs werden häufig die Überschriften von Posts oder Kategorien verwendet. Eine Bildergalerie verwendet dagegen die Tags, sprich Schlüsselwörter, für die einzelnen Bilder. Ein Bild kann hier selbstverständlich auch mehr Schlagworte besitzen. In den meisten Fällen werden gute Suchergebnisse wirklich auch erst mit einer Vielzahl an Schlagwörtern möglich, da bei der Bildsuche eine Volltextsuche, eine Suche nach Begriffsketten oder Verknüpfungen naturgemäß nicht funktioniert.

Hat man die Begriffsmenge bestimmt, die man per Tag-Cloud darstellen möchte, geht es an die Gewichtung. In den meisten Fällen erfolgt die Gewichtung mit Schriftgrößen. Das heißt, die Relevanz eines Begriffs muss in eine Schriftgröße umgerechnet werden. Der einfachste Ansatz ist, eigene Kategorien zu bilden. Bei einem Vorkommen von ein- bis fünfmal wird die kleinste Schriftart verwendet, bei sechs- bis zehnmal die nächstgrößere und so weiter. Ausgangspunkt für einen solchen Algorithmus können die Unter- und die Obergrenze für die Schriftarten sein.

Wie so oft müssen Sie das Rad nicht neu erfinden. Für die meisten Blogs und CMS gibt es bereits Tag-Cloud-Erweiterungen. Der Teufel steckt hier allerdings im Detail: Sie müssen beispielsweise unerwünschte Wörter herausfiltern. Dazu gehören sämtliche Pronomen, Artikel, Hilfsverben und andere wie mein, der, und, oder et cetera ? diese sollten alle nicht in einer Tag-Cloud landen. Den Effekt von solchen inhaltlich sinnlosen Wörtern sehen Sie sehr gut bei den automatischen Tag-Cloud-Generatoren ohne Filter.

Beim Filtern dürfen allerdings auch HTML-Tags und Sonderzeichen nicht vergessen werden. Newzingo bietet beispielsweise eine Tag-Cloud für Google-News, bei der quot eines der dominierenden Wörter ist. Wie Sie sich vielleicht schon denken, ist quot das HTML-Sonderzeichen für ein doppeltes Anführungszeichen, das für Zitate in Überschriften von Nachrichten verwendet wird. Kein Wunder also, dass quot den Irak und alle anderen Stichwörter spielend hinter sich lässt.

Ein weiteres Problem ist die Gewichtung ? hier gilt es, eine vernünftige Verteilung zu finden, damit einzelne Suchbegriffe weder untergehen noch zu stark herausragen. In der Praxis ist bei einigen Tag-Clouds zu beobachten, dass viel zu viele Tags zugelassen werden. Das mag für Experimente spannend sein, führt aber schließlich zu einer für den Nutzer kaum noch handhabbaren Masse.


Schriftgröße und Farben

Tag-Clouds aus Design- und Usability-Sicht

Aus technischer Sicht ist eine Tag-Cloud verhältnismäßig schnell eingesetzt. Wie aber sieht es aus gestalterischer Sicht aus? Die Gewichtung der Begriffe in einer Tag-Cloud sollte sich natürlich optisch wiederfinden. Der übliche Ansatz sind unterschiedliche Schriftgrößen. Das allein führt allerdings gern zu einer Textwüste, die für den Nutzer kaum noch zu erfassen ist. Modernere Ansätze verwenden zusätzlich noch Farben, um die verschieden gewichteten Begriffe zu unterscheiden. Hier ist die Frage, wie viel Gewichtung man gerne hätte. Zu viel Farbe kann natürlich auch verwirren oder zumindest eine Legende erfordern. Besser ist es da natürlich, wenn die Optik komplett selbsterklärend ist. Werden die weniger häufigen Tags nicht nur kleiner sondern auch noch in hellerem Grau hinterlegt, klickt sicherlich niemand mehr darauf. Das heißt also, je stärker die Gewichtung, desto betonter wird das sowieso schon Betonte.

Eine wichtige Kritik aus Usability-Sicht an Tag-Clouds betrifft das unreflektierte Aufführen von Begriffen. Da steht George neben NATO und Laden wird von bin getrennt. Gerade Letzteres verschleiert natürlich im Deutschen den Kontext. Steht Laden nun für ein Geschäft oder doch für den Terroristen? Hier helfen die Beziehungen zwischen den einzelnen Suchbegriffen. Bei Google News Cloud unter wird das für Google News durch Hervorhebungen beim Rollover gemacht. Der Leser erkennt dann an weißer Schrift auf rotem Hintergrund, was zusammengehört. Klickt er auf einen Suchbegriff, erhält er die zugehörigen Links.

Die nächste Usability-Frage betrifft die Anordnung der einzelnen Tags. In der Praxis finden sich hier meist drei Sortiervarianten: nach Wichtigkeit, nach Vorkommen beziehungsweise Zufall oder alphabetisch. Optisch hat das große Auswirkungen. Die typische Tag-Cloud-Optik ist eher eine wilde Wolke mit Begriffen, während vor allem die Sortierung nach Wichtigkeit weniger an eine Wolke, sondern eher an einen schmaler werdenden Wurm oder einen Sehtest beim Augenarzt erinnert.

Sicherheit

Tag-Clouds sind ein Produkt des Taggings, des Zuweisens von Begriffen zu Links beziehungsweise Inhalten. Das kann automatisiert aus Blog-Inhalten oder Suchergebnissen erfolgen, kann aber auch den Nutzern überlassen werden. Sobald der Nutzer ins Spiel kommt, beginnt es in Sachen Sicherheit problematisch zu werden. Ein Beispiel: Der Nutzer soll Bilder in einer Bildergalerie mit Tags versehen. Wenn Sie zehn Nutzer an diese Aufgabe setzen und zehn verschiedene Bilder verschlagworten lassen, haben Sie garantiert zehn verschiedene Resultate. Und ob nun vom böswilligen Nutzer beabsichtigt oder vom unbedarften zufällig erzeugt: Unter den Tags werden schlechte Tags und problematische Begriffe sein. Das fängt bei der Rechtschreibung an und hört bei Schimpfwörtern noch lange nicht auf.

Die Qualität der vom Nutzer generierten Tags lässt sich nur sehr schwer verbessern. Review-Verfahren sind umständlich, und schwarze Listen mit unerwünschten Begriffen scheitern an absichtlichen Rechtschreibfehlern und tausenden Variationsmöglichkeiten. Große Sites wie Flickr oder Del.icio.us haben es hier ein wenig leichter, da die kritische Masse an Nutzern zumindest teilweise zur Steuerung der erfolgreichen Begriffe beiträgt. Auf kleineren Portalen kann eine von Nutzern gesteuerte Tag-Cloud aber zum Albtraum werden.

Bei aller Kritik am nutzergesteuerten Tagging gibt es natürlich auch Positives zu vermelden. Zwar wird ein solches Tagging-Verfahren nicht die Qualität eines Thesaurus erhalten, sie kann aber gerade durch ungewöhnliche Begriffe eine neue Suchqualität liefern. Wer aufgeschlossen sucht, findet in Tag-Clouds Begriffe, an die er vielleicht noch nicht gedacht hat.


Einsatzzwecke

Tag-Clouds aus Design- und Usability-Sicht

Eine Unmenge an Tag-Clouds beschäftigt sich mit News. Häufiges Opfer sind die Google News, die selbst Nachrichten aus verschiedenen Quellen zusammenfassen. Interessant ist hier auch der Web-2.0-Dienst Zoomclouds.egrupos.net. Er generiert Tag-Clouds aus beliebigen RSS-Feeds und kann so beispielsweise auch zur Nachrichten-Aufbereitung genutzt werden.

Andere Einsatzgebiete von Tag-Clouds liegen in Statistik und Marktforschung. Beispielsweise erlaubt eine Keyword-Tag-Cloud mit den wichtigsten Schlüsselwörtern einen völlig neuen Blick auf die Suchbegriffe, mit denen Nutzer auf Ihre Website kommen. Praktisch ist beispielsweise der eBay-Tag-Cloud-Generatot von Alex Schultz. Dort lässt sich eine Tag-Cloud für ein Land und eine eBay-Kategorie erstellen. Das erlaubt interessante Einblicke in die Suchbegriffe von eBay-Nutzern und zeigt mögliche Trends. Etwas weiter gedacht, lässt sich ein solches Mittel natürlich auch im Intranet und in Wissensdatenbanken verwenden. Dort kommen oftmals schon ähnliche Algorithmen zum Einsatz, die optische Gewichtung ist allerdings oftmals ein noch neuer Ansatz.

Dass die Häufigkeit oder Relevanz von Begriffen nicht der einzige interessante Parameter für Tag-Clouds sein muss, zeigt das Beispiel chir.ag/phernalia/preztags. Hier werden Reden von US-Präsidenten analysiert. Neben der Worthäufigkeit gibt es noch eine zeitliche Dimension. Über einen Schieberegler kann der Nutzer angefangen bei George W. Bush in die Vergangenheit reisen und vergleichen, welche Begriffe beispielsweise für den Amtsvorgänger Bill Clinton besonders wichtig waren.

Dieser Vergleich ist zwar historisch extrem interessant, hinkt aber dennoch ein wenig. Zu leicht kann aus der neutralen Gewichtung ein Beweis werden, dass George Bush ein Kriegstreiber ist, da er hauptsächlich über Terroristen und den Irak gesprochen hat, Bill Clinton dagegen über die Familie. Tag-Clouds reduzieren hier komplexe Themen auf die pure Begrifflichkeit.

Neue Wege

Sowohl die Zeitachse für die Präsidenten als auch die Verknüpfung für Begriffe bei den Google-News haben schon gezeigt, dass Tag-Clouds bei weitem noch nicht am Ende ihrer Möglichkeiten sind. 83degrees.com stellt beispielsweise eine Tag-Cloud als einzige Navigation in den Vordergrund. Dieser Ansatz wird zwar sicherlich auf einige wenige Sites beschränkt bleiben, dennoch darf man auf kommende Innovationen gespannt sein.

Einen anderen Ansatz zeigt eine auf Flash basierende Google-Newsmap. Hier werden Nachrichten nach ihrer Relevanz in unterschiedlich große Quadrate gepackt und farblich nach Kategorien sortiert. Vergleichen Sie dies mit der normalen Google-News-Seite, erhalten Sie eine Ahnung davon, wie solche Ansätze in Zukunft den Zugriff auf Informationen revolutionieren könnten.

Bis dahin ist es allerdings noch ein weiter Weg: Gerade kleinere Informationen gehen leicht unter. Viele Nachrichten sind nur dank Rollover-Informationskästchen lesbar, und die Farbsortierung nach Rubriken benötigt auf jeden Fall eine Legende. Wer noch einen Schritt weiter denken möchte, könnte sich solche Tag-Clouds auch als räumliche Bilder in einer dreidimensionalen Welt vorstellen.


Fazit

Tag-Clouds aus Design- und Usability-Sicht

Vermutlich sind Tag-Clouds nur eine Übergangsform hin zu neuen Arten der optischen Informationsaufbereitung, interessant sind sie aber auf alle Fälle. Zwar gibt es noch wenig gesicherte Daten, wie viele Nutzer Tag-Clouds überhaupt regelmäßig benutzen und ob sie dann auch dorthin gelangen, wohin sie möchten, aber sie haben es dennoch schon auf arrivierte Newsportale wie Spiegel.de geschafft. Das allein ist natürlich noch kein Grund, selbst eine Tag-Cloud einzusetzen. Wenn Sie aber Informationen haben oder vom Nutzer schaffen lassen können, die sich gut nach verschiedenen Relevanzkriterien ordnen lassen, ist eine Tag-Cloud auf jeden Fall einen Versuch wert.