False Positives oder Wenn der Spamfilter Kommentare schluckt
Seit gestern um 16.20 schien die Kommentarfunktion des deutschen Inquirer ausgefallen zu sein. Unser technischer Projektleiter folgte der Spur der verschwundenen Kommentare. Und fand False Positives.
Die gibt es, wenn ein lernfähiger Spamfilter immer schärfere Maßstäbe anlegt und am Ende wie ein Pitbull reagiert, der sich wahllos in alles verbeißt. Auf einen Spamfilter zu verzichten ist aber schon lange nicht mehr drin, da die dann erst recht einsetzenden Wellen von Kommentarspam an den Servern zerren und die Erreichbarkeit einer Site gefährden. Eine internationale Publikation wie der Inquirer, den es in fünf Ländern und Sprachen gibt, ist solchen Angriffen in besonderem Maße ausgesetzt – die Lektion haben wir auch schon durch.
Seit August 2007 kommt hier der Spamfilter Akismet zum Einsatz, der sich allein beim deutschen Inquirer seither durch das Einfangen von 13.811 Stück Kommentarspam bewährt hat. Dieser Filter lernt ständig hinzu durch die Spammeldungen zahlreicher WordPress-Blogs und auch anderer CMS-Systeme, die ihn einsetzen. Und manchmal lernt er zuviel und erkennt richtige Kommentare fälschlicher Weise als Spam. Und schickt sie in die große Tonne mit dem echten Spam.
Als Gegenmaßnahme ist De-Spamming angesagt, also die falsch einsortierten Kommentare in der Spamgrube zu suchen und als „No Spam“ zu kennzeichnen. Sie werden dann mit mehr oder weniger Verspätung hier lesbar, und zugleich sollte das den selbstlernenden Filter allmählich wieder zu mehr Augenmaß erziehen. Machen wir, und hoffentlich wirkt es bald. Es kann aber leider eine Zeitlang bedeuten, dass Kommentare hier erst verzögert erscheinen.
Und noch ein Hinweis, damit Kommentare schneller hier lesbar werden: Unabhängig von dieser derzeit übersteigerten Filterfunktion sind auch immer Kommentare händig freizugeben, die zwei oder mehr URLs enthalten. Denn Postings mit mehreren Webadressen haben eine relativ hohe Spamwahrscheinlichkeit und kommen daher erst in eine Wartespur im Admin-Bereich von WordPress.
(bk)