Hallo, ich habe vor Kurzem einmal den Abbyy Finereader ausprobiert. Das Ergebnis ist nicht besonders gut. Nur wenn der (Maschinen-)Text gerade, sauber und kontrastreich abfotografiert ist, funktioniert die Texterkennung. Welches OCR-Programm wäre für die angehängten Bilder geeignet?
Ominpage gibt recht gute Ergebnisse. Allerdings sind die Vorlagen zerknittert und wellig und die Aufnahmen nicht mit der optischen Achse senkrecht auf der Vorlage erfolgt sowie teilweise unscharf. Ich kenne kein Programm, das automatisch oder halbautomatisch solche Einflüsse kompensiert und würde damit rechnen das auch Omnipage relativ schlechte Ergebnisse bringt. Evtl. ist das manuelle Abtippen schneller und kostengünstiger.
Ach ja. Die ungleichmässige Ausleuchtung ist auch ein negativer Faktor.
Stefan Helmert schrieb: > sauber und kontrastreich abfotografiert Ich vermute einfach mal das die meisten OCR Programm auch nicht für abfotografierte Dokumente ausgelegt sind, und so ein geknülle erst recht nicht.
Gerade Abbyy wirbt damit, abfotografierte Texte dekodieren zu können http://finereader.abbyy.de/full_feature_list/digital_camera_ocr/ http://www.google.de/#hl=de&source=hp&q=ocr+handy
>Gerade Abbyy wirbt damit, abfotografierte Texte dekodieren zu können
Das mag wohl so sein. Lese ich auch. Aber hier kommt eben noch die
Tatsache hinzu, das die Papiere Falten haben, ungleichmässig
ausgeleuchtet und gewölbt sind.
Na wie auch immer: Was wir nicht wissen, ist, welchen Erkennungsgrad der
TO eigentlich bei den gezeigten Dokumenten erreicht hat . Von daher ist
ein Ratschlag sowieso eher von begrenztem Wert.
Grundsätzlich ist die Erkennung bei der 3.Kopie und Arial noch eingermaßen erfolgreich möglich. Bei Schrift mit Serifen (wie oben) und schlechter optischer Qualität wird es ungünstig. Erschwerend hinzu kommt noch die verlustbehaftete JPG-Komprimierung und schlechte Ausleuchtung, das Bild verschlimmern. Meiner bisherigen Erfahrung nach, wäre hier eine Erkennung von 50% der Buchstaben ein Erfolg! In leichten Fällen hilft dabei die Rechtschreibkorrektur unterstützend. Bei Stücklisten z.B. ist jedoch eine Nachkontrolle dringend zu empfehlen! Woher soll das OCR-Programm wissen, ob 16 Eimer Senf oder 166 richtig waren, wenn Fliegendreck auf dem Papier war?
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.