Forum: PC Hard- und Software optical character recognition: Empfehlung?

optical character recognition: Empfehlung?

von E-Techniker (Gast)

12.09.2011 18:56

Lesenswert?

•

Hallo,

ich habe eine eingescannte PDF Datei, die recht gross ist
(viel Text,wenig Bilder). Ich würde sie gerne "durchsuchbar" machen.
Habt ihr eine Empfehlung für mich was ich aus dem opensource/freeware
Bereich nehmen könnte?

Win7 oder Linux erstmal egal

Grüße

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: optical character recognition: Empfehlung?

von Peter II (Gast)

12.09.2011 19:01

Lesenswert?

•

▲
▼

E-Techniker schrieb:
> Habt ihr eine Empfehlung für mich was ich aus dem opensource/freeware
> Bereich nehmen könnte?

leider kein Opensource oder Freeware aber es gibt eine Test-Version
http://finereader.abbyy.de/

(die Beste OCR die ich jemals getestet hatte)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: optical character recognition: Empfehlung?

von Läubi .. (laeubi)

12.09.2011 19:05

Lesenswert?

•

▲
▼

http://www.devgeek.de/2011/04/29/debian-schrifterkennung-ocr-mit-tesseract/
Ergebnisse sind für gelegentlichen Einsatz ganz brauchbar.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: optical character recognition: Empfehlung?

von Christian B. (casandro)

12.09.2011 19:07

Lesenswert?

•

▲
▼

Keiner Tipp. Immer nur eine Seite gleichzeitig analysieren lassen, sonst 
sinkt die Erkennungsquote bei allen Programmen gewaltig.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: optical character recognition: Empfehlung?

von Peter II (Gast)

12.09.2011 19:10

Lesenswert?

•

▲
▼

Christian Berger schrieb:
> Keiner Tipp. Immer nur eine Seite gleichzeitig analysieren lassen, sonst
> sinkt die Erkennungsquote bei allen Programmen gewaltig
Warum sollte das so sein, alle Programme die ich bis jetzt getestet 
hatte haben eh jede Seite getrennt verarbeitet.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: optical character recognition: Empfehlung?

von Matthias N. (nippey)

12.09.2011 19:11

Lesenswert?

•

▲
▼

Ich werfe noch mal unbewertet Tesseract dazu:
http://code.google.com/p/tesseract-ocr/
[Freeware!]

Habe damit bisher nur einzelne Wörter verarbeitet, das aber erfolgreich.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Thread beobachten |

Seitenaufteilung abschalten

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.

Bestehender Account

Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen

Noch kein Account? Hier anmelden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net