OCR-Software: Finereader 8.0 Pro/Omnipage 15
Texterkennung vom Digital-Foto

Software

Anwender benötigen jetzt keinen Scanner mehr, wenn sie Papierdokumente einlesen möchten. Aktuelle OCR-Programme erkennen Textseiten, die mit der Digicam abfotografiert wurden. Ob das wirklich funktioniert, zeigt der Test.

Testbericht

OCR-Software: Finereader 8.0 Pro/Omnipage 15

Die Marktführer bei OCR-Software gibt es jetzt in neuen Versionen: Beide lesen Texte auch von qualitativ minderwertigen Vorlagen wie Faxen ab. Der Clou: Auch mit der Digicam fotografierte Texte erkennen die OCR-Engines (Optical Character Recognition). Die Schrift wird in Word, PDF oder andere Formate konvertiert. Der Test zeigt, dass beide Tools dabei akkurater arbeiten als die Vorgänger. Jede der 21 Prüfdateien lesen die Kandidaten in höchstens fünf Sekunden ein. Layout und Text erkennen sie in bis zu 40 Sekunden.

Finereader hat großen Ressourcen-Hunger, was es den Testsieg kostet. Das Tool benötigt einen PC mit 2-GHz-CPU und 512 MByte Arbeitsspeicher. Das Testsystem mit Pentium III/700 und 256 MByte RAM zwingt Finereader in die Knie. Omnipage läuft auf dem PC langsam, aber komfortabel.

Bei der Erkennungsleistung und PDF-Verarbeitung unterscheiden sich die Kandidaten kaum. Seiten mit 5-Punkt-Schrift erkennen die Programme nur lückenhaft. Dabei berücksichtigen die Tester, dass eine Scan-Auflösung von 300 dpi für die OCR als ideal gilt. Das Resultat bessert sich, wenn die Seiten mit 600 dpi erneut eingelesen werden. Um das Kleingedruckte in Verträgen zu digitalisieren, ist die höhere Auflösung Plicht.

Bei Faxen mit niedriger Auflösung zeigt sich im Test die gute Vorverarbeitung der Vorlagen: Finereader und Omnipage korrigieren die Seiten und liefern bis auf wenige Zeichenfehler einwandfreie Ergebnisse. In exportierten Word- sowie PDF-Dateien stimmen das Layout, der Spaltenfluss und die Schriftart mit dem Original überein freilich nur, wenn der richtige Font installiert ist.


Text auf Digitalfotos erkennen

OCR-Software: Finereader 8.0 Pro/Omnipage 15

Nur der Finereader beansprucht für sich, Texte aus Digitalkamera-Bildern verarbeiten zu können. Omnipage liest Fotos aber ebenso ein. Im Test nimmt die 4-Megapixel-Kamera Lumix DMC-FZ10 von Panasonic mit lichtstarker Optik (F2,8) eine Buch-Doppelseite von oben und eine Tabelle aus seitlicher Perspektive auf. Wenn eine Vorlage perspektivisch verzerrrt abgelichtet wird, liefert kein Kandidat brauchbare Texte. Omnipage liest in der Tabelle 20 von 29 Zeilen aus, Finereader nur die unterste Zeile. Auf den Buchseiten identifizieren die OCR-Tools knapp 95 Prozent der Zeichen korrekt. Für die Praxis heißt das: Die Texterkennung klappt nur bei reflexionsfreier, guter Ausleuchtung und ohne perspektivische Verzerrung.

Für das Erfassen mehrsprachiger Dokumente besitzen Finereader und Omnipage Funktionen, mit denen der User die Software auf verschiedene Sprachen in einem Text einstellen kann. Die automatische Wahl der Erkennungssprache ist nicht möglich. Bei falscher Einstellung lesen die Programme Akzente als deutsche Umlaute. Bis auf solche Feinheiten konvertieren Finereader und Omnipage multilinguale Papiervorlagen nahezu 1:1 in digitale Dokumente. Das gilt auch für Tabellen mit und ohne Zellenbegrenzungen, in denen Einträge als Klartext oder kryptische Zeichenfolgen erscheinen.


Texte direkt vom Bildschirm ablesen

OCR-Software: Finereader 8.0 Pro/Omnipage 15

Ein Zusatzfeature von Omnipage ist die Ausgabe der Texte als WAV-Audio. So kann sich der User Briefe von wohlklingenden Sprecherinnen vorlesen lassen. Auch Sehbehinderte profitieren von dieser Vorlesefunktion. Abbyy belohnt Finereader-User für die Registrierung mit dem pfiffigen Screenshot Reader. Das Tool erkennt Texte in Grafiken oder Flash-Animationen. Im Test konvertiert das Utility die Buchstaben zuverlässig, wenn die eingestellte Sprache korrekt ist. Ansonsten ist Zeichensalat das Ergebnis.

Omnipage und Finereader produzieren auch bei schlechter Vorlagenqualität lesbare Texte. Die Unterschiede bei der Erkennung sind marginal, Finereader benötigt dafür jedoch mehr Rechenpower.


Testergebnis Finereader 8.0 Pro

OCR-Software: Finereader 8.0 Pro/Omnipage 15

Hersteller: Abbyy
Produktname: Finereader 8.0 Pro

Internet: Abbyy Homepage
Preis: 150 Euro (Aktuelle Software im testticker.de-Softwareshop)

Das ist neu
– Texterkennung auch auf Digicam-Fotos
– Support für geschützte PDFs und Tagged PDF
– Screenshot Reader erkennt Text auf dem Display

Systemvoraussetzungen
Betriebssysteme : Win 98 SE/Me/NT 4.0/2000/XP
Prozessor/RAM: Pentium 4/2000 (empf.)
Arbeitsspeicher: 512 MByte (empf.)

Fazit
Das Erkennen von Text auf Digitalfotos klappt genau wie das Auslesen von qualitativ schlechten Dokumenten. Der Screenshot Reader liest auch Display-Texte. Nur der Ressourcen-Hunger ist zu hoch.

Gesamtwertung: sehr gut
Leistung (50%): sehr gut
Ausstattung (30%): sehr gut
Bedienung (20%): gut


Testergebnis Omnipage 15

OCR-Software: Finereader 8.0 Pro/Omnipage 15

Hersteller: Scansoft
Produktname: Omnipage 15

Internet: Scansoft Homepage
Preis: 130 Euro (Aktuelle Software im testticker.de-Softwareshop)

Das ist neu
– Texterkennungs-Engine auch auf Digicam-Fotos
– SET-Korrektur entfernt Bildfehler und -störungen
– wandelt Papier in durchsuchbare PDFs

Systemvoraussetzungen
Betriebssysteme : Windows 98 SE/Me/2000/XP
Prozessor/RAM: Pentium III/700 (empf.)
Arbeitsspeicher: 256 MByte (empf.)

Fazit
Das Einlesen von Tabellen erledigt Omnipage zuverlässig. Der Schwerpunkt liegt auf der Wiederherstellung des Original-Layouts. Das beherrscht das Scansoft-Programm in der Version 15 jetzt noch besser.

Gesamtwertung: sehr gut
Leistung (50%): sehr gut
Ausstattung (30%): sehr gut
Bedienung (20%): sehr gut