Forum: PC-Programmierung Suche einfache OCR als ActiveX


von Mehmet K. (mkmk)


Angehängte Dateien:

Lesenswert?

Servus allerseits

Ich suche eine einfache OCR Software, die ich via ActiveX in mein 
eigenes Program einbinden kann. Das Bild enthaelt jeweils nur ein paar 
Zahlen und Buchstaben; d.h. an die Software werden keine grossen 
Anforderungen gestellt. Beispiel im Anhang.
Darf auch ruhig was kosten (so um die 100 Euro).

Es ist mir bekannt, dass Microsoft Document Imaging ein solches Mittel 
zur Verfügung stellt, aber es waere schön, wenn's ohne MS ginge.

Für mich zwar nicht geeignet, hat mich aber schwer beeindruckt:
http://jocr.sourceforge.net (nur command-line und unterstützt nur pbm 
format)

Dank im voraus.

von Peter (Gast)


Lesenswert?

> Für mich zwar nicht geeignet, hat mich aber schwer beeindruckt:
> http://jocr.sourceforge.net (nur command-line und unterstützt nur pbm
> format)
wenn dich jocr schon beieindruck dann schau mal bei den richtigen vorbei 
(Finereader), sie bieten auch OCX an aber nicht kostenlos

von Mehmet K. (mkmk)


Lesenswert?

Du meinst ABBY FineReader? Als ich sagte, "es darf was kosten", 
skizzierte ich die Grenze um die 100 Euro-Marke. :)
Die haben ja für ihr Software Development Kits ja nicht mal den Preis 
angeben!

von Mehmet K. (mkmk)


Lesenswert?

Zwar nicht gerade das, was ich mir gewünscht hatte, aber bis ich was 
gefunden habe muss folgende Lösung herhalten:
1
i_view32.exe C:\Downloads\PG.jpg /convert=C:\Downloads\PG.pbm
2
gocr048.exe pg.pbm > x.txt

i_view32.exe: http://www.irfanview.com/
gocr048.exe: http://jocr.sourceforge.net/

von Frank E. (Firma: Q3) (qualidat)


Lesenswert?

Du solltest vorher ein wenig Bildbearbeitung machen, das erleichtert 
Vieles. Im Beispiel: nur Grün-Kanal, Kontrast angehoben. Danach:

Schau' dir mal Tesseract an, ist ein Open Source Projekt (war mal 
kommerziell bei HP), läuft als Command Line Tool.

http://de.wikipedia.org/wiki/Tesseract_%28Software%29

Frank

von Mehmet K. (mkmk)


Lesenswert?

Wenn du wüsstest, wieviele OCR Programme ich schon durchgehaechelt habe 
... :)

Also der Tesseract liest soweit ich noch in Errinnerung habe nur Tiff 
Formate ein. Mein Bild ist aber JPG.

BTW: Habe mich zwischenzeitlich an meine nicht gerade sehr elegangte 
Lösung gewöhnt. Geht ruck-zuck; und Fehlinterpretationen seitens GOCR 
hatte ich bis jetzt auch nie.

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.