Forum: Mikrocontroller und Digitale Elektronik Texterkennung auf einem Display + Auswertung


von Simon (Gast)


Lesenswert?

Hallo zusammen,

ich arbeite gerade an einem Konzept für eine "automatische 
Textkontrolle" von Anzeigedisplays auf Basis eines Mikrocontrollers. 
Dieser soll Anzeigetexte auf einem Display erkennen und auf Korrektheit 
überprüfen.

Beispiel:

Eine Messung dauert 10 Sekunden. Innerhalb dieser Zeit muss kontrolliert 
werden, ob ein definierter Anzeigetext vom Testgegenstand (Display) 
gezeigt wurde oder nicht. Es werden 100 Messungen durchgeführt, 
Anzeigetext Nr. 1 ist "Test1", Anzeigetext Nr. 2 ist "Test2" (...) 
Anzeigetext Nr. 100 ist "Test100".

Nun hätte ich am Ende gerne eine Textdatei zur Auswertung generiert:
Test1: TRUE
Test2: TRUE
Test3: FALSE
...

Die Daten am Ende vom Mikrocontroller auf den PC in eine .txt zu 
schreiben bekomme ich selber hin.

Meine Frage:

Wie mache ich das mit der Erkennung eines Textes? Ich bräuchte quasi 
eine Kamera, die für einen Zeitraum die Anzeige eines Displays 
"mitfilmt" und als plausibles Ergebnis in Form eines Textes an den 
Mikrocontroller sendet.

Gibt es für sowas fertige Hard -und Softwarelösungen? Wenn ja welche? Da 
verschiedene Displays getestet werden müssen, darf keine Problematik bei 
der Texterkennung aufgrund verschiedener Anzeigefonts, Schriftgrößen, 
... entstehen.

Kosten sollte alles wie immer so wenig wie möglich :-D Vielen Dank für 
Eure Gedanken zu dem Thema.

Gruß Simon

von Alex G. (dragongamer)


Lesenswert?

Für Fertiglösungen ist "Smartcamera" das Stichwort. Davon gibt es einige 
in der Industrie. Fangen aber im vierstelligen Preisbereich an.
Mit einem Microcontroler sind die Aussichten eher bescheiden. Viel eher 
ein Raspberry Pi: 
https://hackaday.io/project/9669-texteye-raspberry-pi-zero-mobile-textreader
Übrigens, die technik bezeichnet man als "OCR". Optical Character 
Recognition.

: Bearbeitet durch User
von Blick auf die Startseite (Gast)


Lesenswert?

Das da könnte der Aufgabe gewachsen sein:
Beitrag "ESP32-CAM Entwicklungskit"

von Simon (Gast)


Lesenswert?

Alex G. schrieb:
> Smartcamera

Alex G. schrieb:
> Für Fertiglösungen ist "Smartcamera" das Stichwort. Davon gibt es
> einige
> in der Industrie. Fangen aber im vierstelligen Preisbereich an.
> Mit einem Microcontroler sind die Aussichten eher bescheiden. Viel eher
> ein Raspberry Pi:
> https://hackaday.io/project/9669-texteye-raspberry-pi-zero-mobile-textreader
> Übrigens, die technik bezeichnet man als "OCR". Optical Character
> Recognition.

Hallo Alex,

danke für die Denkansätze. Ich habe mal ein wenig google durchstöbert - 
alles zu teuer.

Die Idee mit dem Rasperry ist eher das, was ich gesucht habe. Was hälst 
du von folgendem Konzept:

Rasperry PI + Pi Camera module (Summe < 50€) zur Aufnahme der Videos --> 
Übertragung an einen PC mit LabView (ist in der Firma vorhanden, bietet 
anscheinend die OCR Möglichkeit). Hier habe ich auch die Möglichkeit, 
alle Daten sauber zu exportieren.

Spricht was dagegen? Macht das alles Sinn? :-)

von Simon (Gast)


Lesenswert?

Blick auf die Startseite schrieb:
> Das da könnte der Aufgabe gewachsen sein:
> Beitrag "ESP32-CAM Entwicklungskit"

Hört sich auch gut an, danke für den Tipp.

Mir stellt sich die Frage, wie gut die Auflösung/Eigenschaften der 
Kamera sein muss, damit das OCR Programm (welches auch immer) die Texte 
noch zuverlässig erkennt.

von Sönke P. (snke_p)


Lesenswert?

Muss die Erkennung in "Echtzeit" erfolgen?

Wenn nicht, dann könnte Amaz*n Mechanical Turk (https://www.mturk.com/) 
eine gute Möglichkeit sein.

von Alex G. (dragongamer)


Lesenswert?

Simon schrieb:
> Rasperry PI + Pi Camera module (Summe < 50€) zur Aufnahme der Videos -->
> Übertragung an einen PC mit LabView (ist in der Firma vorhanden, bietet
> anscheinend die OCR Möglichkeit). Hier habe ich auch die Möglichkeit,
> alle Daten sauber zu exportieren.
>
> Spricht was dagegen? Macht das alles Sinn? :-)
Da könntest du doch genau so gut eine Webcam am PC nehmen, oder mit dem 
Smartphone/Camcorder aufnehmen.
Der Sinn des Raspis wäre schon dass der auch selber die Analyse der 
Bilder macht.

Da du von Firma sprichst.. wollt ihr irgendwelche Schriftstücke 
massenweise digitalisieren?
Dafür gibt es Dokumentenscanner welche höhere Qualität liefern als 
normale Kameras.

Sönke P. schrieb:
> Muss die Erkennung in "Echtzeit" erfolgen?
>
> Wenn nicht, dann könnte Amaz*n Mechanical Turk (https://www.mturk.com/)
> eine gute Möglichkeit sein.
Also OCR braucht jetzt nicht sooo viel Rechenleistung als dass man auf 
solche externen Resourcen zurückgreifen müsste.

: Bearbeitet durch User
von Jacko (Gast)


Lesenswert?

OK, Raspi mit Kamera und OCR.

- Wie groß ist die Erkennungsgenauigkeit?

- Was ist mit dem üblichen Digit-Fehler?

- Wogegen wird auf TRUE, oder FALSE getestet?

Muss man sich was ausdenken!

Dagegen ist die Auswertung von String-Sequenzen wie
"Test x : TRUE / FALSE" doch lächerlich, da würde auch
"XYZ" reichen.
X = 0...100 (ein Hex-Byte für die Test-Nummer)
Y = '0', oder '1', oder 0, oder 1 (FALSE/TRUE) und
Z = irgendein Trenn-Zeichen reichen.
Womit sich die Ausgabe auch leichter verarbeiten ließe.

"Löst mir mal mein großes Problem, das kleine Problem hab
ich auch schon nicht im Griff"....

von Jacko (Gast)


Lesenswert?

Anzeigedisplay ist ja NOCH schlimmer, als LCD-Display!
Der weiße Schimmel wiehert!

Das erste sagt Anzeige-Anzeige,
das zweite bringt immerhin noch LC zur Anzeige-Anzeige...

von Simon (Gast)


Lesenswert?

> OK, Raspi mit Kamera und OCR.
>
> - Wie groß ist die Erkennungsgenauigkeit?
>
> - Was ist mit dem üblichen Digit-Fehler?
>
> - Wogegen wird auf TRUE, oder FALSE getestet?
>
> Muss man sich was ausdenken!
>
> Dagegen ist die Auswertung von String-Sequenzen wie
> "Test x : TRUE / FALSE" doch lächerlich, da würde auch
> "XYZ" reichen.
> X = 0...100 (ein Hex-Byte für die Test-Nummer)
> Y = '0', oder '1', oder 0, oder 1 (FALSE/TRUE) und
> Z = irgendein Trenn-Zeichen reichen.
> Womit sich die Ausgabe auch leichter verarbeiten ließe.
>
> "Löst mir mal mein großes Problem, das kleine Problem hab
> ich auch schon nicht im Griff"....


Hallo Jacko,

mit Merkmalen wie Erkennungsgenauigkeit, Digit-Fehler etc. habe ich mich 
noch nicht beschäftigt. Mir geht es vorerst nur um´s Prinzip. Auch die 
Auswertung der Zeichenketten werde bekomme ich hin.

Mir geht es primär um die OCR Thematik.


>Der Sinn des Raspis wäre schon dass der auch selber die Analyse der
>Bilder macht.

Das Ding ist, dass neben dem übertragenem Kamerabild auch noch andere 
Sensorik/Aktorik aus LabView heraus gesteuert werden soll. Zum Beispiel 
ein Motor, der die Kamera in die richtige Position fährt. Dazu möchte 
ich den Rasperry oder auch ein anderes Board nutzen. Die Auswertung der 
Kameraaufnahmen sollte ebenfalls durch LabView passieren, ich denke das 
macht am meisten Sinn da es hierfür schon fertige Tools gibt.

Somit machen meiner Meinung nach folgende 2 Konzepte Sinn:

1.: LabView <---> Rasperry <---> Sensorik/Aktorik
    LabView <--- Kamera

ODER

2.: LabView <---> Rasperry <--> Kamera/Sensorik/Aktorik


Bei Konzept 2 werden die ganzen Videodatenmengen noch über den Rasperry 
gejagt....macht eigentlich keinen Sinn oder?

Konzept 1 hat meiner Meinung nach folgende Vorteile:

- LabView Lizenz vorhanden mit einer komfortablen OCR Möglichkeit
- Kostet nicht viel

Letzte Frage: Nach welchen Kriterien sollte die Kamera ausgewählt 
werden? Gibt es da günstige Lösungen auf "Platinenbasis" ?

Gruß Simon

von Simon (Gast)


Lesenswert?

Was mir gerade noch einfällt:

Man könnte doch bestimmt auch ein Smartphone einspannen und dessen 
Kamerabild nach LabView übertragen...wieder was gespart :-D

von Frank E. (Firma: Q3) (qualidat)


Lesenswert?

Weil es sich bei der Texterkennung auf einem Display quasi um 
"originale", perfekt dargestellte Zeichen handelt, die unter optimalen 
Bedingungen aufgenommen werden, sind die Ansprüche an das OCR nicht 
übermäßig hoch.

Im Gegensatz zu den Schwierigkeiten, mit denen ein OCR bei gescannten 
Doukumenten klarkommen muss (schlechte Drucke, farbige Hintergründe, 
schräge Zeilen, unvollständige Buchstaben, Knicke und Wellen im Papier 
usw.), sind das ja hier "himmlische" Bedinungen ...

In der Open Source Welt geistert seit Jahren das Projekt "Tesseract" 
herum, eine einstmals abgebrochene HP-Entwicklung.

: Bearbeitet durch User
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.