Ratgeber: Daten aus dem Internet löschen

Big DataData & StoragePolitikRechtSicherheitSicherheitsmanagement

Das »Reputation Management« wird immer wichtiger für Unternehmen.  Ist eine falsche Information einmal im weltweiten Netz, ist sie nicht mehr so leicht zu entfernen. Wir zeigen, welche Schritte für das Datenlöschen im Internet erforderlich sind.

Politiker und Verbraucherschützer fordern ein Recht auf Vergessen für personenbezogene Daten im Internet.  Viel schlimmer ist jedoch, dass auch wirtschaftlich relevante Themen häufig »aus Versehen« (und manchmal absichtlich) offengelegt sind. Das Problem, Daten aus dem Netz zu löschen, besteht bei jeder Information im Web.

Nicht vorschnell ins Internet

Ein Beispiel: Endlich steht das neue Angebot vor der Markteinführung. Wenn Werbeflyer gedruckt werden sollen, sieht sich der Produktmanager die Bilder immer nochmals genau an. Die E-Mail an den Webmaster mit den Bilddateien schickt er dagegen ohne langes Zögern ab. Sollte sich später herausstellen, dass die Bilder geändert werden müssen, kann dies ja  in dem neuen Content-Management-System (CMS) mit wenigen Klicks erledigt werden.

Doch der Produktmanager sollte die Freigabe zur Online-Veröffentlichung noch genauer prüfen als die Druckfreigabe. Das Löschen von Online-Inhalten im CMS und auf dem eigenen Webserver ist zwar tatsächlich kein Problem, dafür aber das Löschen einmal veröffentlichter Daten im Internet. Soll später das Produktbild wegen eines Fehlers wieder aus dem Netz genommen werden, ist es für ein einfaches Löschen auf Knopfdruck meist schon zu spät.

Einmal online, immer online

Das Internet vergisst nichts, so mahnen Verbraucherschützer vor einer vorschnellen Veröffentlichung persönlicher Details in sozialen Netzwerken. Diese Mahnung gilt aber nicht nur für personenbezogene Daten, sondern für jeden Online-Inhalt im weltweiten Netz. Wenn eine Internetsuchmaschine das neue Produktbild bereits in ihren Datenbestand aufgenommen hat, bleibt eine Kopie im Cache der Suchmaschine erhalten, auch wenn die Bilddatei auf dem eigenen Webserver bereits gelöscht ist.

Und damit nicht genug, halten Webprojekte wie die Wayback Machine von Internet Archive komplette Webseiten in ihrem Archiv vor, auch wenn diese schon seit langem nicht mehr online sind. Wenn zudem die Webseite ihren Besuchern Newsfeeds wie RSS (Really Simple Syndication) anbietet und die Änderung der Webseite bereits an die Newsfeed-Abonnenten übertragen wurde, ist die Mitteilung über die Änderung genauso wenig zurückholbar wie eine bereits verschickte E-Mail.

Alle Speicherorte im Netz finden

Bedacht werden muss auch, dass die Änderung der eigenen Webseiten aktiv von anderen Online-Anbietern beobachtet wird. Unter Umständen hat ein Webshop-Betreiber bereits das neue Produktbild aus dem Download-Bereich heruntergeladen und in seinem Shop-System gespeichert. Vielleicht wurde auch bereits in einem Online-Medium über das neue Produkt berichtet und das fehlerhafte Pressebild veröffentlicht.

Wo überall das Produktbild im Internet gespeichert ist, prüft man am besten mit einer Bildersuche der führenden Internetsuchmaschinen. Neben der Suche nach dem Dateinamen lässt sich hier auch mit der erweiterten Bildersuche gezielt nach den speziellen Bildeigenschaften fahnden.

Daten wieder löschen lassen

Um Änderungen an Webseiten Dritter vornehmen zu lassen, kommt man an der Kontaktaufnahme mit dem jeweils zuständigen Webmaster oder Redakteur nicht vorbei. Die Kopien in den Suchmaschinen-Caches und Webarchiven hingegen kann man automatisch verhindern. Internet Archive zum Beispiel ermöglicht es, die eigene Webseite aus der Archivierung heraus zu nehmen. Dazu ändert man einfach die Datei robots.txt (Robots Exclusion Standard) in dem Hauptverzeichnis (Root) des Webservers. Die Datei robots.txt muss insbesondere enthalten

User-agent: ia_archiver
Disallow: /

Dies blockiert nicht nur die weitere Durchsuchung und Archivierung der Webseite durch die Wayback Machine, sondern entfernt auch die bestehenden Einträge im Archiv.

Anweisungen für Suchmaschinen

Wenn man vermeiden will, dass Suchmaschinen die eigenen Webseiten zwischenspeichern und dadurch unter Umständen fehlerhafte Daten auch nach der eigentlichen Löschung noch vorhalten, muss man den Webseiten einen speziellen Meta-Tag mitgeben:

<META NAME=”ROBOTS” CONTENT=”NOARCHIVE”>

Wenn Inhalte, die einmal auf der Webseite standen, möglichst umgehend aus dem Index von Google und anderen Suchmaschinen gelöscht werden sollen, kann man die Entfernung aus dem Index beantragen. Allerdings muss man dies bei  jeder einzelnen Suchmaschine machen und nicht etwa nur bei einer. Google zum Beispiel bietet ein spezielles Tool zur Entfernung einer URL (Internetadresse) aus dem Google-Index:

www.google.de/remove.html.

Schnell veröffentlicht, kaum noch zu löschen

Informationen, die dank CMS auf Knopfdruck im Internet landen, sind also nur mit großem Aufwand wieder aus dem Netz zu fischen. Wegen der Dynamik des Internets und der schnellen Verbreitung von Online-Informationen kann man nicht sicher sein, wirklich alle Spuren fehlerhafter Informationen aus dem Netz getilgt zu haben.

Da hilft auch kein von verschiedenen Politikern beschworener digitaler Radiergummi wie X-pire. Statt der Löschung von Daten sieht dieses Projekt ein Verfallsdatum vor, ab dem die Bilddaten im Netz nur noch verschlüsselt vorliegen. Mögliche Kopien oder Screenshots der Bilder vor Ablauf des Verfallsdatums können solche Projekte aber nicht verhindern.

Wirklich helfen kann nur eine genaue Prüfung und Freigabe vor jeder Online-Veröffentlichung. Ein Einstampfen wie bei bereits gedruckten, fehlerhaften Werbeflyer ist eben nicht möglich.