Google kauft ReCaptcha
Captcha steht für Completely Automated Public Turing test to tell Computers and Humans Apart, und mittlerweile hat sicher jeder die kleinen Bilder mit Zeichen schon einmal irgendwo im Internet gesehen. Meist schützen sie Weblogs und Foren vor Spam-Kommentaren, da in der Regel nur Menschen die Zeichenketten identifizieren und in ein Formularfeld eintragen können, nicht jedoch Spam-Bots.
Ein Captcha-Service ist ReCaptcha, den Google nun für eine nicht genannte Summe übernommen hat. Das Besondere an ihm: er hilft bei Digitalisierungsprojekten. Werden Bücher oder Zeitungen gescannt und die OCR-Software ist nicht in der Lage, ein Wort zu erkennen, wird es als Captcha verwendet – also von einem Menschenentziffert.
Das funktioniert so: als Captcha werden zwei Worte angezeigt – eines, das die OCR-Software bereits erkannt hat und eines, an dem sie gescheitert ist. Der Benutzer tippt die beiden Worte ins Formularfeld: ist das bekannte Wort korrekt eingegeben worden, geht ReCaptcha davon aus, dass nun auch das bislang unbekannte Wort korrekt erfasst ist. Um Vertipper auszuschließen, wird das Wort allerdings mehreren Nutzern in Captchas präsentiert. (Daniel Dubsky)