User-Tracking
Gläserner Besucher

DeveloperIT-ProjekteSoftware

Eine Website sollte stets auf das Interesse der Nutzer ausgerichtet sein. Internet Professionell zeigt, wie Sie möglichst viel über Ihre Besucher herausfinden und Ihre Seite entsprechend optimieren.

Kundenorientiert

User-Tracking

Das Internet wird immer beliebter und das Erstellen einer eigenen Homepage ist mittlerweile wohl von nahezu jedem problemlos zu meistern. So wundert es nicht, dass die Zahl der Internet-Präsenzen seit etlichen Jahren steil in die Höhe schnellt und sich immer mehr Privatleute und Unternehmen im weltweiten Internet präsentieren.

Während es bei einer privaten Homepage selten eine Rolle spielt, ob diese mehr schlecht als recht gestaltet ist und vielleicht nur alle Hand voll Jahre einmal aktualisiert wird, sieht die Sache bei Unternehmensseiten anders aus: Die einen Firmenseiten wollen das Unternehmen repräsentieren und über dessen Produkte und Dienstleistungen informieren, andere kommerzielle Seiten vertreiben ihre Produkte vielleicht sogar ausschließlich auf digitalem Weg. Eines haben beide Varianten gemeinsam ? die Qualität des Web-Auftritts hängt unmittelbar mit dem Geschäftserfolg zusammen. Ist eine Webseite unübersichtlich oder schlecht programmiert, so findet sich der Kunde selten auf Anhieb zurecht, und schneller, als man bis drei zählen kann, ist er unter Umständen schon zu den Seiten der Konkurrenz weitergesurft. Kurz: Über den Erfolg oder Misserfolg einer Webseite entscheidet zuletzt immer noch der Kunde.

Daher ist es unerlässlich, dass ein Web-Auftritt so gut wie möglich auf die Bedürfnisse der Besucher abgestimmt ist. Um hierfür nur ein Beispiel zu nennen: Kommen zwei Drittel der Surfer mit einer Bildschirmauflösung von 800×600 Bildpunkten auf Ihren Seiten vorbei, werden Sie sich kaum viele Fans machen, wenn Ihre Seiten für eine Auflösung von 1280×1024 optimiert sind. Viele wird das ärgern, und sie kommen nie wieder.


Die Lösung: User-Tracking

User-Tracking

Um nun Ihre Webpräsenz so ideal wie möglich an Ihren potenziellen Kundenstamm anzupassen, müssen Sie freilich auch möglichst viel über diese wissen ? von nichts kommt nichts. Daher sollten Sie das Verhalten der Besucher Ihrer Seiten so detailliert wie möglich protokollieren und analysieren. Interessante Fragen sind hierbei zum Beispiel unter anderem die folgenden:

– Von welcher anderen Seite kommt der User zu mir?

– Welche Inhalte meiner Seite werden am häufigsten angesehen?

– Welche Bildschirmauflösung wird verwendet?

– Welche Webbrowser und Betriebssysteme kommen zum Einsatz?

Doch wie kommt man nun an die gewünschten Informationen heran? Einfach den Besucher des eigenen Web-Auftritts zu fragen ist wohl in den seltensten Fällen möglich. Das Feedback auf einen entsprechenden Fragebogen dürfte zum einen eher niedrig sein, und zum anderen zeugt es nicht gerade von besonders hoher Professionalität, wenn man die Besucher offen fragt, was man besser machen sollte.


Wichtigste Datenquelle: Logfiles

User-Tracking

Jeder Webserver protokolliert sämtliche Anfragen von Clients in seinen Protokolldateien. Aus diesen Logfiles können Sie bereits eine Menge nützlicher Informationen über die Besucher Ihrer Seiten herauslesen.

Die meisten Webhoster gestatten ihren Kunden auch auf Shared-Hosting-Paketen den Zugriff auf diese Dateien, so dass Sie diese nur noch auszuwerten brauchen. Oft finden sich auf den Administrationsseiten Ihrer Webpräsenz zudem entsprechende Tools zur grafischen Aufbereitung der Daten. Ein hierfür beliebtes Tool ist der Webalizer, welcher die Logfiles des Apache-Webservers in zahlreichen Varianten direkt auf dem Server übersichtlich grafisch darstellt. Auf der letzten Seite dieses Beitrags finden Sie einen Workshop zu Webalizer, der Ihnen zum Beispiel hilft, das Programm auf einem dedizierten Server einzurichten. Einen ausführlichen Artikel finden Sie in der Ausgabe 1/2004 der Internet Professionell. Eine weitere Möglichkeit ist die Nutzung spezieller Analyse-Tools wie Nedstat, die das User-Tracking bis ins Detail vertiefen.


Logfiles im Detail

User-Tracking

Wenn Sie die Logfiles auf eigenem Wege auswerten möchten, zum Beispiel über eine Excel-Tabelle, ist es wichtig, dass Sie mit dem Aufbau der Protokolldateien vertraut sind. Das Standardformat für Logfiles ist CLF, was für das Common Logfile Format steht. Sehen Sie sich im Folgenden einmal eine Zeile eines Apache-Logfiles im Detail an:

192.168.80.119 ? ? [04/Aug/2004:17:53:12 +0200]
"GET /index.php HTTP/1.1" 200 24053
"http://www.testticker.de"
"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)"

Was auf den ersten Blick unübersichtlich und unsortiert wirkt, enthält in geordneter Reihenfolge zahlreiche interessante Daten über unseren Besucher.

Zu Beginn finden Sie die IP-Adresse des Clients, von dem die Anfrage kommt, im Beispiel 192.168.80.119, gefolgt vom Datum und der Uhrzeit, zu der der Zugriff erfolgt ist. Der folgende String gibt an, mit welcher Methode und HTTP-Version auf welche Datei zugegriffen wurde ? im Beispiel wurde mit GET und HTTP 1.1 auf die Datei index.php zugegriffen. Die zwei folgenden Nummern geben den an den Client zurückgelieferten Statuscode sowie die gesendeten Daten in Bytes an. Die Statuscodes sind hierbei dieselben, wie Sie sie vielleicht schon vom Surfen im Web kennen, beispielsweise 404 für eine nicht gefundene Datei.

Die beiden letzten Angaben sind besonders interessant. Der angegebene URL ist der Referrer, also die Seite, die der Client zuvor aufgerufen hat. Jedoch unterbinden mittlerweile zahlreiche Clients den Referrer, so dass diese Information oft nicht zur Verfügung steht. Auch viele Personal Firewalls bieten entsprechende Funktionen zum Unterdrücken des Referrers. Zu guter Letzt werden noch Browser und Betriebssystem des Besucher-Rechners angezeigt. Besonders der Browser-Typ und die Versionsnummer helfen dabei, die Webseiten an das Gros der Besucher anzupassen.


Noch mehr Detailinfos

User-Tracking

Neben den bereits bis jetzt herausgefundenen Daten über die Site-Besucher interessieren natürlich noch viele weitere Dinge. Diese lassen sich jedoch nicht mehr wie die obigen Daten vergleichsweise einfach aus den Logfiles herauslesen. Eine einfache Lösung zum Herankommen an weitere Informationen ist die Skriptsprache Javascript, mit der sich schnell und bequem zahlreiche Daten sammeln lassen. So können Sie zum Beispiel die Bildschirmauflösung mit Hilfe vorgegebener Umgebungsvariablen in Erfahrung bringen. Im nebenstehenden Kasten finden Sie eine Übersicht über die wichtigsten Umgebungsvariablen. Damit stehen eine Menge weiterer Daten zur Verfügung.

Um an die Informationen zu kommen, benötigen Sie lediglich ein kleines Skript. Dieses können Sie zum Beispiel unauffällig am Beginn des HTML-Codes unterbringen:


Wanzen-Alarm

User-Tracking

Nun müssen die mit Javascript auslesbaren Daten natürlich noch irgendwie zu Ihnen kommen. Hierzu kann man so genannte Webbugs verwenden. Dabei handelt es sich im weitesten Sinne um den Nachfolger der altbekannten Cookies. Diese haben schon seit jeher den Nachteil, dass ihr Setzen über die Browser-Einstellungen seitens des Besuchers verhindert werden kann.

Mit den bislang meist unbekannten Webbugs lässt sich die Abwehr der Benutzer gegen das Datensammeln geschickt umgehen. Die Webbugs, auch oft als Clear GIFs bezeichnet, stoßen jedoch vielerorts auf große Ablehnung ? so haben diese den faden Beigeschmack, dass der Surfer gar nicht mitbekommt, dass über ihn Daten gesammelt werden. Die Bugs sind für ihn unsichtbar und es wird ihm nicht mitgeteilt, dass sie zum Einsatz kommen. So können Sie unbemerkt Daten sammeln.

Webbugs sind kleine GIF-Files, normalerweise mit einer Größe von 1x1 Pixel, die sich sogar in anderen Grafiken verstecken lassen. Nur wer sich den Quellcode einer Seite ansieht, kann den Einsatz dieser Technik erkennen. Mit den kleinen Wanzen lassen sich neben der IP-Adresse, dem Zeitpunkt sowie den Informationen eines zuvor gesetzten Cookies noch vieles mehr übertragen und auswerten.

Diese Webbugs können Sie im Zusammenhang mit dem Sammeln von User-Informationen verwenden. Ob Sie diese Möglichkeit einsetzen oder nicht, bleibt natürlich Ihnen überlassen. Auf Grund der kontroversen Diskussionen um die Wanzen könnte deren Einsatz jedoch auch zu einem Eigentor werden.

Der ein oder andere Besucher könnte skeptisch werden, wenn er vom Einsatz solcher Wanzen erfährt, und Ihre Seiten daraufhin meiden. Nicht jeder Webnutzer lässt sich gerne auf diese Art und Weise die Sammel-Wut eines Seitenbetreibers aufoktroyieren.


Webbugs auf Ihrer Seite

User-Tracking

Um die mit Javascript herausgefundenen Daten mit Hilfe von Webbugs an den Server zu übermitteln, kommt wie beschrieben eine manipulierte Grafik zum Einsatz. Anstatt innerhalb einer HTML-Seite im img-Tag die tatsächliche Adresse eines Bildes festzulegen, wird im src-Parameter ein Skript angegeben, das das jeweilige Bild ausliefert. Das entsprechende Skript erledigt im Hintergrund dann natürlich deutlich mehr als nur das reine Ausliefern der Grafik. Vielmehr werden nützliche Daten eingesammelt.

Wenn Sie diese Webbugs auf Ihren Seiten einsetzen wollen, finden Sie mit Hilfe einer Suchmaschine wie Google einige nützliche Quellen mit ausführlichen Anleitungen.


Profi-Dienste zum Datenspähen

User-Tracking

Neben dem Datensammeln im Eigenbau können Sie auch die Dienste darauf spezialisierter Unternehmen in Anspruch nehmen; zu diesen zählt beispielsweise Etracker. Ab gut einem Euro pro Monat schaut der Dienst den Besuchern Ihrer Seite auf die Finger und protokolliert für Sie, was diese so auf Ihrer Webpräsenz treiben. Die gesammelten Daten lassen sich dann übersichtlich aufbereitet einsehen und nutzen.


Rechtliche Aspekte

User-Tracking

Das entsprechende Sammeln von Daten über die Besucher der eigenen Website ist keinesfalls immer unbedenklich. Vor allem sollte man gegenüber den Besuchern der eigenen Webpräsenz ehrlich sein und offen kommunizieren, dass die verfügbaren Daten gespeichert werden und für eine weitere Verarbeitung Verwendung finden.

Wenn es sich bei den gesammelten Daten jedoch lediglich um triviale Dinge wie den Browsertyp und die Monitorauflösung handelt, können Sie sorgenfrei weitersammeln, ohne dies explizit erwähnen zu müssen. Hierbei handelt es sich lediglich um anonyme Daten, welche keine Rückschlüsse auf einen Nutzer zulassen.

Jedoch ist bereits die IP-Adresse nach Auffassung der Datenschutzbehörden ein personenbezogenes Merkmal, da zumindest über den Access-Provider eindeutig Rückschlüsse auf den Nutzer gezogen werden können. Daher gilt es bei der Speicherung der IP-Adresse bereits einiges zu beachten und den User darauf hinzuweisen.

Bei Cookies hängt es stets davon ab, welche Informationen über diese gespeichert werden. Auch hier gehen die Datenschutzbehörden davon aus, dass es sich jedenfalls um so genannte pseudonyme Daten handelt. Dies hat zur Folge, dass der Seitenbetreiber auf den Einsatz von Cookies hinweisen muss und der Nutzer darüber zu informieren ist, wie über die Browsereinstellungen Cookies ausgeschlossen werden können.

Im Idealfall hält der Seitenbetreiber eine Datenschutzerklärung vor, eine so genannte Privacy Policy, in der er über seine Datenschutzpolitik aufklärt und den Nutzer auf seine diesbezüglichen Rechte hinweist. Vor allem bei einer kommerziellen Website sollten Sie auf eine solche Privacy Policy mit Hinweisen über Ihre Datenschutzpolitik keinesfalls verzichten. So sorgt diese bei den Besuchern Ihrer Website für eine sicheres Gefühl. Sagen Sie dem Besucher offen, wie Sie mit den über ihn gespeicherten Daten umzugehen gedenken.