mikrocontroller.net

Forum: PC Hard- und Software suche beste OCR-Software


Autor: Stefan Helmert (Firma: dm2sh) (stefan_helmert)
Datum:
Angehängte Dateien:

Bewertung
0 lesenswert
nicht lesenswert
Hallo,

ich habe vor Kurzem einmal den Abbyy Finereader ausprobiert. Das 
Ergebnis ist nicht besonders gut. Nur wenn der (Maschinen-)Text gerade, 
sauber und kontrastreich abfotografiert ist, funktioniert die 
Texterkennung.

Welches OCR-Programm wäre für die angehängten Bilder geeignet?

Autor: Guru (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Ominpage gibt recht gute Ergebnisse.

Allerdings sind die Vorlagen zerknittert und wellig und die Aufnahmen 
nicht mit der optischen Achse senkrecht auf der Vorlage erfolgt sowie 
teilweise unscharf. Ich kenne kein Programm, das automatisch oder 
halbautomatisch solche Einflüsse kompensiert und würde damit rechnen das 
auch Omnipage relativ schlechte Ergebnisse bringt.

Evtl. ist das manuelle Abtippen schneller und kostengünstiger.

Autor: Guru (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Ach ja. Die ungleichmässige Ausleuchtung ist auch ein negativer Faktor.

Autor: Läubi .. (laeubi) Benutzerseite
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Stefan Helmert schrieb:
> sauber und kontrastreich abfotografiert
Ich vermute einfach mal das die meisten OCR Programm auch nicht für 
abfotografierte Dokumente ausgelegt sind, und so ein geknülle erst 
recht nicht.

Autor: bk (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Gerade Abbyy wirbt damit, abfotografierte Texte dekodieren zu können
http://finereader.abbyy.de/full_feature_list/digit...

http://www.google.de/#hl=de&source=hp&q=ocr+handy

Autor: Guru (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
>Gerade Abbyy wirbt damit, abfotografierte Texte dekodieren zu können

Das mag wohl so sein. Lese ich auch. Aber hier kommt eben noch die 
Tatsache hinzu, das die Papiere Falten haben, ungleichmässig 
ausgeleuchtet und gewölbt sind.

Na wie auch immer: Was wir nicht wissen, ist, welchen Erkennungsgrad der 
TO eigentlich bei den gezeigten Dokumenten erreicht hat . Von daher ist 
ein Ratschlag sowieso eher von begrenztem Wert.

Autor: oszi40 (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Grundsätzlich ist die Erkennung bei der 3.Kopie und Arial noch 
eingermaßen erfolgreich möglich. Bei Schrift mit Serifen (wie oben) und 
schlechter optischer Qualität wird es ungünstig. Erschwerend hinzu kommt 
noch die verlustbehaftete JPG-Komprimierung und schlechte Ausleuchtung, 
das Bild verschlimmern. Meiner bisherigen Erfahrung nach, wäre hier eine 
Erkennung von 50% der Buchstaben ein Erfolg! In leichten Fällen hilft 
dabei die Rechtschreibkorrektur unterstützend.

Bei Stücklisten z.B. ist jedoch eine Nachkontrolle dringend zu 
empfehlen! Woher soll das OCR-Programm wissen, ob 16 Eimer Senf oder 166 
richtig waren, wenn Fliegendreck auf dem Papier war?

Antwort schreiben

Die Angabe einer E-Mail-Adresse ist freiwillig. Wenn Sie automatisch per E-Mail über Antworten auf Ihren Beitrag informiert werden möchten, melden Sie sich bitte an.

Wichtige Regeln - erst lesen, dann posten!

  • Groß- und Kleinschreibung verwenden
  • Längeren Sourcecode nicht im Text einfügen, sondern als Dateianhang

Formatierung (mehr Informationen...)

  • [c]C-Code[/c]
  • [avrasm]AVR-Assembler-Code[/avrasm]
  • [code]Code in anderen Sprachen, ASCII-Zeichnungen[/code]
  • [math]Formel in LaTeX-Syntax[/math]
  • [[Titel]] - Link zu Artikel
  • Verweis auf anderen Beitrag einfügen: Rechtsklick auf Beitragstitel,
    "Adresse kopieren", und in den Text einfügen




Bild automatisch verkleinern, falls nötig
Bitte das JPG-Format nur für Fotos und Scans verwenden!
Zeichnungen und Screenshots im PNG- oder
GIF-Format hochladen. Siehe Bildformate.
Hinweis: der ursprüngliche Beitrag ist mehr als 6 Monate alt.
Bitte hier nur auf die ursprüngliche Frage antworten,
für neue Fragen einen neuen Beitrag erstellen.

Mit dem Abschicken bestätigst du, die Nutzungsbedingungen anzuerkennen.