Forum: PC Hard- und Software automatische OCR Debian / Thunderbird


Announcement: there is an English version of this forum on EmbDev.net. Posts you create there will be displayed on Mikrocontroller.net and EmbDev.net.
von OCR (Gast)


Lesenswert?

Hallo Forum,

auf der Arbeit bekomme ich zwischen 50-80 Bilder von verschiedenen 
Typenschildern per Mail. Für Datenbanksuchen muss ich mir jedes mal die 
Seriennummern (zwischen 6-14 Zeichen) abtippen. Nun suche ich eine 
Software für Debian oder ein Addon für Thunderbird welches eine 
automatische Zeichenerkennung beim öffnene der Bilder laufen lässt.
Euer Reiner

von wendelsberg (Gast)


Lesenswert?

Welche Fehlerquote ist akzeptabel?

wendelsberg

von OCR (Gast)


Lesenswert?

Für Debian dürfte Tesseract zur Verfügung stehen, bei reinen Zahlen ist 
die Erkennungsquote ziemlich hoch.

Im Thunderbird muss man dann in den Einstellungen nicht den 
Bildbetrachter, sondern die OCR-Software aktivieren.

von OCR (Gast)


Lesenswert?

kurze Beschreibung von Tessereact, isz zwar Ubuntu, dürfte für Debian 
auch passen

https://wiki.ubuntuusers.de/tesseract-ocr/

von OCR (Gast)


Lesenswert?

Wenn ein bis zwei Zeichen pro Seriennummer falsch sind, wäre es noch 
akzeptabel und immernoch eine Zeitersparnis

von OCR (Gast)


Lesenswert?

Hat jemand einen Link wie ich bei der Einbindung von Tesseract in 
Thunderbird vorgehen muss?

von Johannes R. (entity)


Lesenswert?

Je nachdem wie automatisch es sein soll.
Hier muss man per hotkey den OCR starten, und dann manuell den zu 
erfassenden Bildschirmausschitt auswählen.
https://github.com/yasirtug/ni-translate
Aber vielleicht reicht das ja, bzw. besser als nichts.

von OCR (Gast)


Lesenswert?

Hi Johannes,
klasse, so habe ich mir das auch in etwa vorgestellt! Ich installiere es 
direkt mal und probiere es aus.
Euer Reiner

von Christoph db1uq K. (christoph_kessler)


Lesenswert?

Ich benutze als grafische Oberfläche gimagereader, der verwendet im 
Hintergrund Tesseract (das war mal von Hewlett-Packard und wurde dann 
zur freien Software erklärt).
Es gibt auch eine Software, die direkt ein durchsuchbares PDF erzeugt, 
aber die ist leider etwas zu automatisch und nicht konfigurierbar. 
Google setzt die ein zur Bücherdigitalisierung.

von Thomas (kosmos)


Lesenswert?

Da es nichts sensitive ist, Google docs. Ich finde die Erkennung auch 
von schlechten Kopien sehr gut.

: Bearbeitet durch User
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.