Forum: PC Hard- und Software suche beste OCR-Software


von Stefan H. (Firma: dm2sh) (stefan_helmert)


Angehängte Dateien:

Lesenswert?

Hallo,

ich habe vor Kurzem einmal den Abbyy Finereader ausprobiert. Das 
Ergebnis ist nicht besonders gut. Nur wenn der (Maschinen-)Text gerade, 
sauber und kontrastreich abfotografiert ist, funktioniert die 
Texterkennung.

Welches OCR-Programm wäre für die angehängten Bilder geeignet?

von Guru (Gast)


Lesenswert?

Ominpage gibt recht gute Ergebnisse.

Allerdings sind die Vorlagen zerknittert und wellig und die Aufnahmen 
nicht mit der optischen Achse senkrecht auf der Vorlage erfolgt sowie 
teilweise unscharf. Ich kenne kein Programm, das automatisch oder 
halbautomatisch solche Einflüsse kompensiert und würde damit rechnen das 
auch Omnipage relativ schlechte Ergebnisse bringt.

Evtl. ist das manuelle Abtippen schneller und kostengünstiger.

von Guru (Gast)


Lesenswert?

Ach ja. Die ungleichmässige Ausleuchtung ist auch ein negativer Faktor.

von Läubi .. (laeubi) Benutzerseite


Lesenswert?

Stefan Helmert schrieb:
> sauber und kontrastreich abfotografiert
Ich vermute einfach mal das die meisten OCR Programm auch nicht für 
abfotografierte Dokumente ausgelegt sind, und so ein geknülle erst 
recht nicht.

von bk (Gast)


Lesenswert?


von Guru (Gast)


Lesenswert?

>Gerade Abbyy wirbt damit, abfotografierte Texte dekodieren zu können

Das mag wohl so sein. Lese ich auch. Aber hier kommt eben noch die 
Tatsache hinzu, das die Papiere Falten haben, ungleichmässig 
ausgeleuchtet und gewölbt sind.

Na wie auch immer: Was wir nicht wissen, ist, welchen Erkennungsgrad der 
TO eigentlich bei den gezeigten Dokumenten erreicht hat . Von daher ist 
ein Ratschlag sowieso eher von begrenztem Wert.

von oszi40 (Gast)


Lesenswert?

Grundsätzlich ist die Erkennung bei der 3.Kopie und Arial noch 
eingermaßen erfolgreich möglich. Bei Schrift mit Serifen (wie oben) und 
schlechter optischer Qualität wird es ungünstig. Erschwerend hinzu kommt 
noch die verlustbehaftete JPG-Komprimierung und schlechte Ausleuchtung, 
das Bild verschlimmern. Meiner bisherigen Erfahrung nach, wäre hier eine 
Erkennung von 50% der Buchstaben ein Erfolg! In leichten Fällen hilft 
dabei die Rechtschreibkorrektur unterstützend.

Bei Stücklisten z.B. ist jedoch eine Nachkontrolle dringend zu 
empfehlen! Woher soll das OCR-Programm wissen, ob 16 Eimer Senf oder 166 
richtig waren, wenn Fliegendreck auf dem Papier war?

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.