Forum: PC Hard- und Software Text als.JPG in Dokument Umwandeln?


von Herbert Z. (herbertz)


Lesenswert?

Hallo!
Ich finde immer interessante Bauanleitungen im Netz mit englischem Text 
welchen ich nur per Screenshot und speichert als JPG sicher kann. Das 
ganze lässt sich so nicht in einen Translator einfügen. Hat jemand einen 
Tip wie ich trotzdem zu einer Übersetzung komme ? Ich probiere schon 
rum, einiges muss ich noch testen. Gibt es ein Tool?
MfG

von Peter G. (metalfranke)


Lesenswert?

z.B. Google Lens.


Gruß Peter

von Christoph db1uq K. (christoph_kessler)


Lesenswert?

Die Schrifterkennung gimagereader ist kostenlos, damit kann man auch pdf 
direkt erkennen lassen.
https://sourceforge.net/projects/gimagereader/
https://github.com/manisandro/gImageReader/releases

von Mario M. (thelonging)


Lesenswert?

Wie wäre es mit Kopieren und Einfügen statt Bildschirmkopie als Grafik? 
Für Text in Grafikdatei gibts OCR. Es gibt auch Übersetzer die beides 
machen.

von Niklas G. (erlkoenig) Benutzerseite


Lesenswert?

Hier die URL der zu übersetzenden Seite eingeben:

https://translate.google.com/?sl=auto&tl=de&op=websites

von Herbert Z. (herbertz)


Lesenswert?

Mario M. schrieb:
> Wie wäre es mit Kopieren und Einfügen statt Bildschirmkopie als Grafik?
> Für Text in Grafikdatei gibts OCR. Es gibt auch Übersetzer die beides
> machen.

Gibt echt Seiten die Informationen liefern würden aber nur wenn man sich 
anmeldet. Wenn man sich nicht anmelden will, bleibt nur der Screenshot.
Vorteil, man kann alles als Bild erstellt das ganze vom Müll drumherum 
befreien.
Gerade sehe ich bei meinem PDF- Reader ,dass der Text erkennen kann...
Da fällt mir was ein, weil Libre Office Writer in PDF konvertieren kann. 
Das werde ich gleich testen...

von Niklas G. (erlkoenig) Benutzerseite


Lesenswert?

Herbert Z. schrieb:
> Gibt echt Seiten die Informationen liefern würden aber nur wenn man sich
> anmeldet

Google Chrome kann doch jede beliebige Seite live übersetzen, egal ob 
angemeldet oder nicht.

von Herbert Z. (herbertz)


Lesenswert?

Bingo!
Also ich habe das Foto mit dem Text in ein Libre Office Textdokunment 
eingefügt und das ganze in ein PDF konvertiert. Im PDF Reader konnte ich 
dann die Bildschrift in Text umwandeln. Jetzt kann ich übersetzen und 
die Übersetzung mir als Textdokument speichern. Sind mehrere Schritte 
aber es geht. Ich freue mich!

Niklas G. schrieb:
> Google Chrome kann doch jede beliebige Seite live übersetzen, egal ob
> angemeldet oder nicht.

Google kann nicht alles übersetzen und wenn doch , dann lässt sich das 
auf manchen Seiten nicht kopieren, bleibt nur der Screenshot.

von Bradward B. (Firma: Starfleet) (ltjg_boimler)


Lesenswert?

> Ich finde immer interessante Bauanleitungen im Netz mit englischem Text
> welchen ich nur per Screenshot und speichert als JPG sicher kann. D

Man macht es den OCR tools einfacher sobald man das Ganze als *.png mit 
wenigen Farben ohne dithering abspeichert. *.Jpg fügt dem Ganzen weitere 
Fehler zu.

Und die Übersetzung sollte man unbedingt händisch überarbeiten, es soll 
technische Katastrophen gegeben haben, weil man fremde Baupläne 
nachbaute ohne sie zu verstehen.

https://de.wikipedia.org/wiki/Not-invented-here-Syndrom

von Ein T. (ein_typ)


Lesenswert?


von Herbert Z. (herbertz)


Lesenswert?

Bradward B. schrieb:
> *.Jpg fügt dem Ganzen weitere
> Fehler zu.

Im Textfoto gibt es nur schwarz und weiß..., mehrere Teile lassen sich 
sinnvoll zusammenfügen und unwichtiges ausschneiden...

von Norbert (der_norbert)


Lesenswert?

Herbert Z. schrieb:
> Also ich habe das Foto mit dem Text in ein Libre Office Textdokunment
> eingefügt und das ganze in ein PDF konvertiert. Im PDF Reader konnte ich
> dann die Bildschrift in Text umwandeln. Jetzt kann ich übersetzen und
> die Übersetzung mir als Textdokument speichern. Sind mehrere Schritte
> aber es geht. Ich freue mich!

Ein schönes Beispiel für:
Von hinten durch die Brust ins Auge geschossen.

von Nemopuk (nemopuk)


Lesenswert?

Norbert schrieb:
> Ein schönes Beispiel für:
> Von hinten durch die Brust ins Auge geschossen.

Mag sein, aber dafür mit Software die er schon kennt und hat.

von Herbert Z. (herbertz)


Lesenswert?

Norbert schrieb:
> Ein schönes Beispiel für:
> Von hinten durch die Brust ins Auge geschossen.

Ein gutes Beispiel für nur lästern...

von Norbert (der_norbert)


Lesenswert?

Herbert Z. schrieb:
> Ein gutes Beispiel für nur lästern...

Ach, da interpretierst du zu viel hinein.
Wenn ich lästere, dann merkt man das.

von Niklas G. (erlkoenig) Benutzerseite


Lesenswert?

Herbert Z. schrieb:
> Google kann nicht alles übersetzen und wenn doch , dann lässt sich das
> auf manchen Seiten nicht kopieren, bleibt nur der Screenshot.

Warum noch kopieren wenn du es dann einfach in der übersetzten Form 
lesen kannst? Kannst ja auch immer noch als (übersetztes) PDF speichern.

von Mario M. (thelonging)


Lesenswert?

Herbert Z. schrieb:
> Gibt echt Seiten die Informationen liefern würden aber nur wenn man sich
> anmeldet. Wenn man sich nicht anmelden will, bleibt nur der Screenshot

Da fehlt mir gerade die Phantasie. Magst Du uns ein Beispiel nennen?

von Harald K. (kirnbichler)


Lesenswert?

Herbert Z. schrieb:
> Bradward B. schrieb:
>> *.Jpg fügt dem Ganzen weitere
>> Fehler zu.
>
> Im Textfoto gibt es nur schwarz und weiß..., mehrere Teile lassen sich
> sinnvoll zusammenfügen und unwichtiges ausschneiden...

Hier hat Beumel recht - Jpg ist wegen der Kompressionsartefakte 
ungeeignet. Nimm PNG. Das kann man genauso zusammenstückeln, aber es 
entfallen die Kompressionsartefakte. Keine Matschkanten an 
Schwarz/Weiß-Kontrasten.

von Frank E. (Firma: Q3) (qualidat)


Lesenswert?

Ein T. schrieb:
> Herbert Z. schrieb:
>> Gibt es ein Tool?
>
> Tesseract OCR [1,2].
>
> [1] https://github.com/tesseract-ocr/tesseract
> [2] https://tesseract-ocr.github.io/tessdoc/#tesseract-user-manual

Mal eine Frage, leicht off-topic: Wird Tesseract eigentlich noch 
"inhaltlich" weiter entwickelt? Ich meine bezüglich der benutzten 
Algorithmen?

Soweit ich weiss, stammt die OCR-Engine ursprünglich aus einem 
kommerziellen Projekt von HP, was aber aufgegeben wurde. Um "etwas 
Gutes" zu tun, wurde der Code der OpenSource-Gemeinde überlassen. Das 
war aber schom in den 1990er Jahren ...

: Bearbeitet durch User
von Norbert (der_norbert)


Angehängte Dateien:

Lesenswert?

Frank E. schrieb:
> Mal eine Frage, leicht off-topic: Wird Tesseract eigentlich noch
> "inhaltlich" weiter entwickelt? Ich meine bezüglich der beutzten
> Algorithmen?

»tesseract a.png a.txt«

: Bearbeitet durch User
von Harald K. (kirnbichler)


Lesenswert?

Frank E. schrieb:
> Wird Tesseract eigentlich noch
> "inhaltlich" weiter entwickelt?

Sieh Dir die Commits etc. auf https://github.com/tesseract-ocr/tesseract 
an.

Ja, es ist davon auszugehen, daß das weiterentwickelt wird; es wird im 
wissenschaftlichen Bereich (Bibliothekswesen) verwenden, um auch ältere 
Schriftsysteme wie Fraktur zu digitalisieren.

von Herbert Z. (herbertz)


Lesenswert?

Nemopuk schrieb:
> Mag sein, aber dafür mit Software die er schon kennt und hat.

Genauso ist es. Geht schneller als wenn man sich irgendwo einarbeiten 
muss.

Harald K. schrieb:
> Hier hat Beumel recht - Jpg ist wegen der Kompressionsartefakte
> ungeeignet. Nimm PNG. Das kann man genauso zusammenstückeln, aber es
> entfallen die Kompressionsartefakte. Keine Matschkanten an
> Schwarz/Weiß-Kontrasten.

Nach dem Übersetzen ist das ganz normaler Text in guter Qualität fertig 
um ihn zu kopieren und in Libre Office Writer einzufügen und 
abzuspeichern.

Mario M. schrieb:
> Da fehlt mir gerade die Phantasie. Magst Du uns ein Beispiel nennen?

https://de.scribd.com/document/578569099/Simple-Rx-Magnetic-Loop


...um nur ein Beispiel zu nennen. Solche Sachen gibt es öfter als es mir 
lieb ist. Ich will mich aber nicht immer überall anmelden und meine 
Daten verbreiten.

von Frank E. (Firma: Q3) (qualidat)


Lesenswert?

Harald K. schrieb:

> Ja, es ist davon auszugehen, daß das weiterentwickelt wird; es wird im
> wissenschaftlichen Bereich (Bibliothekswesen) verwenden, um auch ältere
> Schriftsysteme wie Fraktur zu digitalisieren.

Da hängt wohl auch damit zusammen, dass es ein Tool gibt, um Tesseract 
für bisher unbekannte Schriften zu trainieren. Aller dings war das nur 
extrem kryptisch zu bedienen ...

: Bearbeitet durch User
von Harald K. (kirnbichler)


Lesenswert?

Herbert Z. schrieb:
> Nach dem Übersetzen ist das ganz normaler Text in guter Qualität

Ich hab' irgendwie den Verdacht, daß Du nicht verstanden hast, worum es 
geht.

Es geht um das QUELLMATERIAL, das Du zurechschnibbelst, um es Deiner OCR 
vorzuwerfen. Und wenn das QUELLMATERIAL die üblichen JPEG-Artefakte 
enthält (egal, ob das jetzt s/w oder bunt ist), dann erhöht das völlig 
unnötig die Fehlerrate Deiner OCR.

PNG kannst Du exakt genauso zurechtschnibbeln wie JPG, aber es enthält 
keine Kompressionsartefakte und liefert daher bessere OCR-Ergebnisse.

(Wenn Du Deine Dokumente übrigens auf solchen Seiten wie "scribd" 
betrachtest, dürfte dieser Link Dir einiges an lästiger Arbeit ersparen: 
https://scribd.vdownloaders.com/)

von Herbert Z. (herbertz)


Lesenswert?

Harald K. schrieb:
> (Wenn Du Deine Dokumente übrigens auf solchen Seiten wie "scribd"
> betrachtest, dürfte dieser Link Dir einiges an lästiger Arbeit ersparen:

Habe ich gerade getestet...geht, aber das Prozedere bis man durch ist 
dauert länger als ganze so zu machen wie ich das beschrieben habe.
Danke trotzdem für den Link.

von Bradward B. (Firma: Starfleet) (ltjg_boimler)


Angehängte Dateien:

Lesenswert?

>
> Im Textfoto gibt es nur schwarz und weiß..., mehrere Teile lassen sich
> sinnvoll zusammenfügen und unwichtiges ausschneiden...

Wenn das Textfoto nur schwarz und weiß hat, dann ist das gut, das sollte 
man aber denoch überprüfen. Hier habe ich mal ein Teil einer Textanzeige 
als screenshot ausgeschniden, in eine Bildverarbeitung geladen, das 
Histogramm anzeigen lassen und wiederum ausgeschnitten und unverändert 
als png abgepeichert. (sieha Anhang)

Und lt. Histogramm ist das Textfenster nicht zweiwertig aschwarz und 
weiß sondern besteht aus ca 13 Farbtönen. Ich tippe das solchesolche 
"Windows-Ausgabe-Verbesserungen"  wie Subpixelschärfung (Cleartype) und 
reduzierung Blautöne gegen Kopfschmerzen (Blaulichtfilter) dazu führen, 
das ein "Textfoto" unerwarteterweise mehr als nur schwarz und weiss 
enthält. Das macht es der OCR nicht einfacher, denke ich.

* https://de.wikipedia.org/wiki/Subpixel-Rendering
* 
https://www.giga.de/tipp/windows-10-blaulichtfilter-nachtmodus-aktivieren/

von Harald K. (kirnbichler)


Lesenswert?

Herbert Z. schrieb:
> aber das Prozedere bis man durch ist
> dauert länger als ganze so zu machen wie ich das beschrieben habe.

Äh ... keine Ahnung, was Du da anstellst. Wenn Du nur einseitige 
Dokumente betrachtest, mag das sein, aber wenn es um mehrseitige 
Dokumente (Datenblätter, Bücher etc.) geht, dann definitiv nicht. Da 
fällt 'ne PDF-Datei raus und fertig.

Wenn man keinen Adblocker verwendet, wird man vermutlich mit Reklame 
zugeschissen, aber genau deswegen verwendet man ja Adblocker.

von Herbert Z. (herbertz)


Lesenswert?

Harald K. schrieb:
> Äh ... keine Ahnung, was Du da anstellst.

Ich habe das auf dieser SCRIPD Seite mit deinem Link als PDF 
herunterladen können. Allerdings in englisch. Dann habe ich das PDF im 
Google Übersetzer
ins deutsche übersetzt. Soweit so gut! Vorteil Ich habe das samt Fotos 
in einer PDF Datei. Aber mein Problem ist so oder so gelöst.
Danke allen welche sich konstruktiv geäußert haben.
MfG

von Jens G. (jensig)


Lesenswert?

Herbert Z. schrieb:
> Also ich habe das Foto mit dem Text in ein Libre Office Textdokunment
> eingefügt und das ganze in ein PDF konvertiert. Im PDF Reader konnte ich
> dann die Bildschrift in Text umwandeln.

Bis jetzt hast Du ja noch nicht geschrieben, dass die englische 
Bauanleitung mit Text, die Du verwursten willst, direkt in eine Grafik 
eingebettet ist (Du redest nur von Screenshot als Quelle). Also nutze 
doch einfach die Druckfunktion des Browser, und wähle als Ziel PDF aus. 
Dann hast Du Dein PDF mit echtem Text ...

von Peter G. (metalfranke)


Angehängte Dateien:

Lesenswert?

> https://de.scribd.com/document/578569099/Simple-Rx-Magnetic-Loop
>
>
> ...um nur ein Beispiel zu nennen. Solche Sachen gibt es öfter als es mir
> lieb ist. Ich will mich aber nicht immer überall anmelden und meine
> Daten verbreiten.

Soll die Übersetzung so etwa aussehen?

von Frank E. (Firma: Q3) (qualidat)


Lesenswert?

Deepl übersetzt besser als Google.

Mit einem Deeple Pro Account habe ich schon ganze Bücher (300-400 
Seiten) übersetzt. Limit ist übrigens nicht die Anzahl der Zeichen oder 
Worte, sondern die rein physische Dateigröße.

von Christoph db1uq K. (christoph_kessler)


Angehängte Dateien:

Lesenswert?

Harald K. schrieb:
> um auch ältere
> Schriftsysteme wie Fraktur zu digitalisieren.

In gimagereader gibt es eine wählbare Erkennung von Frakturschrift- Hab 
gerade mal ein Bild erkennen lassen, irgendwo gefunden
https://www.fraktur.com/storage/images/... (elend lange URL)

Das Ergebnis ist nicht sehr ermutigend:

Zur freien Entwiclung nad allen
Seiten bedarf jede Pflanze etwas
Luft und Licht, das ihr gerade fo
meit gewährt werden muß, als zur
Befundheit, Dichtigfeit und Fülle
aller nötig ift.

Es ift dies die Freiheit der Bäume,
nach der wir ung ebenfalls

fo fehr fehnen.

die Schrifterkennung lispelt, das "s" ist ein Problem.

: Bearbeitet durch User
von Lu (oszi45)


Lesenswert?

Herbert Z. schrieb:
> welchen ich nur per Screenshot und speichert als JPG sicher kann

Bei schlechten Bildern ist oft die OCR-Erkennung weniger fehlerfrei. Der 
Google-Übersetzer hat jedoch einige Heim-Vorteile, da er viele 
Wörterbücher als Vergleichsmaterial kennt.

von Norbert (der_norbert)


Lesenswert?

Tesseract (Standard)
1
Zur freien Entwiclung nach allen
2
Seiten bedarf jede Pflanze etwas
3
Luft und Licht, das ihr gerade fo
4
weit gewahrt werden mug, als zur
5
Sefundheit, Dichtigteit und Fille
6
aller notig ift.
7
8
G8 ift dies die Fretheit ber Gaume,
9
nach det wit uns ebenfalls
10
11
fo feht fehnen.
12
13
First Hermann von Piickler-Muskau

von Karlsson V. (karlsson_vom_dach)


Angehängte Dateien:

Lesenswert?

ChatGPT 5.2 kann das fehlerfrei.

von Harald K. (kirnbichler)


Lesenswert?

Karlsson V. schrieb:
> ChatGPT 5.2 kann das fehlerfrei.

Das muss gar nichts bedeuten. Das kommt auch dann zustanden, wenn der 
KI-Slop-Generator in seinem Trainingsmaterial irgendwo eine Abbildung 
des Textes und eine Transkription gesehen hat.

Dem KI-Slop-Generator würde ich deswegen nocht lange keine Fähigkeiten 
andichten.

von Lu (oszi45)


Lesenswert?

Karlsson V. schrieb:
> ChatGPT 5.2 kann das fehlerfrei.

KI kann nur das fehlerfrei, wo vorher ein Muster gelernt wurde.
Wenn es eine alte Stückliste in Frakturschrift gewesen wäre, wo kein 
Muster davon im Web zu finden ist, wären die Ergebnisse schlechter.

von Norbert (der_norbert)


Angehängte Dateien:

Lesenswert?

Aus:
„Rabrunsel las dein Baart herunter.“, rief der Prins zum Torm herauf.

wird durch ShitGPT:
„Rabunsel lass dein Bart herunter“, rief der Prinz zum Tor hinauf.

Die Frage ist nun, möchte ich eine Texterkennung oder eine geratene 
Interpretation unter magischem Pilzbrühen-Einfluß.

von Ralf X. (ralf0815)


Lesenswert?

Norbert schrieb:
> Die Frage ist nun, möchte ich eine Texterkennung oder eine geratene
> Interpretation unter magischem Pilzbrühen-Einfluß.

Viel Spass mit einer wörtlichen Übersetzung eines aktuellen Textes aus 
traditionellem chinesisch.

von Bradward B. (Firma: Starfleet) (ltjg_boimler)


Angehängte Dateien:

Lesenswert?

> Das muss gar nichts bedeuten. Das kommt auch dann zustanden, wenn der
> KI-Slop-Generator in seinem Trainingsmaterial irgendwo eine Abbildung
> des Textes und eine Transkription gesehen hat.

Oder der Namen des Autors verlinkt mit der Zitatesammlung seiner. Bspw.:
https://www.garten-literatur.de/Leselaube/pueckl.htm

Grad bei alten Texten deren Schutzrechte abgelaufen sind, gibt es nicht 
nur Dank des Projektes Gutenberg irgendwie eine aSCII-Version und die 
auch noch in heutiger Rechtschreibung.

https://de.wikipedia.org/wiki/Projekt_Gutenberg-DE

Anbei ein Test-Faksimilie (Rezensionen zu einem Buch) die es IMHO noch 
nicht fertig gescannt gibt. Da wäre interessant, wie Chat-GTP das 
wiedergibt.

von Ralf X. (ralf0815)


Lesenswert?

Bradward B. schrieb:
> Anbei ein Test-Faksimilie (Rezensionen zu einem Buch) die es IMHO noch
> nicht fertig gescannt gibt. Da wäre interessant, wie Chat-GTP das
> wiedergibt.

Google-KI zeigt in Druckbuchstaben folgenden Text:

"EIN PRACHTVOLLES PENDANT ZUM „KATER MURR“ IST:
REINEKE FUCHS
DICHTUNG VON WOLFGANG VON GOETHE
REICH ILLUSTRIRT VON HERMANN SCHÜSSLER

3. AUFLAGE (6.–8. TAUSEND)

PREIS IN LIEBHABEREINBAND GEBUNDEN M. 2.50
„EIN PRÄCHTIGES BILDERBUCH – DIE HUMORVOLLE GESCHICHTE DER ABENTEUER 
REINEKES ZU LESEN IST AN UND FÜR SICH IMMER WIEDER EIN KÖSTLICHER 
GENUSS. DERSELBE WIRD ABER NOCH ERHEBLICH GESTEIGERT, WENN MAN SIE AN 
DER HAND DER VORTREFFLICHEN BILDER HERMANN SCHÜSSLERS DURCHWANDERT. DER 
ZEICHNER HAT WIRKLICH DEN SCHLAUEN ROTPELZ SO LEBENDIG UND 
CHARAKTERISTISCH IM BILDE FESTGEHALTEN, DASS ES EINE HERZERQUICKENDE 
FREUDE IST. NICHT WENIGER LEBENSWAHRHEIT WEISEN DIE BILDER DER ANDEREN 
TIERE, DER FEINDE, FREUNDE, RICHTER DES FUCHSES AUS. FREUDE UND SCHMERZ, 
GRIMM UND ENTTÄUSCHUNG – DIE GANZE SKALA DER EMPFINDUNGEN KOMMT IN IHREN 
MIENEN UND BEWEGUNGEN ZUM AUSDRUCK. JEDEM LIEBHABER DER GOETHESCHEN 
DICHTUNG, JEDEM TIERFREUNDE WIRD DIESES BUCH EIN WILLKOMMENES GESCHENK 
SEIN.“
FRÄNKISCHE VOLKSZEITUNG.
„EINE PRÄCHTIGE AUSGABE.
BRESLAUER ZEITUNG.
... SCHÖNER DRUCK UND AUSGEZEICHNETE HOLZSCHNITTE, ALS DA SIND KOPF- UND 
SCHLUSSSTÜCKE, ABBILDUNGEN IM TEXT UND GANZSEITIGE EINSCHALTBILDER ...“
BOZNER ZEITUNG.
„DIE 44 SCHÖNEN BILDER LASSEN UNS MIT DOPPELTEM VERGNÜGEN DIE GAUNEREIEN 
DES REINEKE VERFOLGEN. FÜR JEDEN TIERFREUND MUSS DAS BUCH GERADEZU EIN 
GENUSS SEIN.“
MAGDEBURG. ZEITUNG.
„EINE ZIERDE FÜR DEN WEIHNACHTSTISCH UND JEDEN SALON ...“
PFÄLZISCHER MERKUR.
„DA SCHLIESSLICH DIE AUSSTATTUNG DIESER AUSGABE DER EWIG JUNGEN DICHTUNG 
GOETHES DURCHAUS GEDIEGEN UND PRÄCHTIG IST, EIGNET SIE SICH GANZ 
BESONDERS ZU EINEM LIEBEN UND WILLKOMMENEN GESCHENK FÜR ALLE.“
BRAUNSCHWEIGER NACHRICHTEN."

von Christoph db1uq K. (christoph_kessler)


Angehängte Dateien:

Lesenswert?

Hier der Text von gimagereader "erkannt", auch wieder mit vielen 
Fehlern.

von Bradward B. (Firma: Starfleet) (ltjg_boimler)


Lesenswert?

> Google-KI zeigt in Druckbuchstaben folgenden Text:
>
...
> „EIN PRÄCHTIGES BILDERBUCH – DIE HUMORVOLLE GESCHICHTE DER ABENTEUER
...
> „DA SCHLIESSLICH DIE AUSSTATTUNG DIESER AUSGABE DER EWIG JUNGEN DICHTUNG
> GOETHES DURCHAUS GEDIEGEN UND PRÄCHTIG IST, EIGNET SIE SICH GANZ
> BESONDERS ZU EINEM LIEBEN UND WILLKOMMENEN GESCHENK FÜR ALLE.“
> BRAUNSCHWEIGER NACHRICHTEN."

Interessant, auf den ersten Blick spricht das IMHO für die Qualität von 
ChatGPT.
Nebenbemerkung: aus dem 'ß' in "schließlich" hat die Software ein "SS" 
gemacht, wohl wegen der Grosschreibung. Und aus dem .. in der ersten 
Rez.-Zeile zwischen "Bilderbuch .. die" wurde ein '-'

> Hier der Text von gimagereader "erkannt", auch wieder mit vielen
> Fehlern.

Auch interessant, vielen Dank.

: Bearbeitet durch User
von Norbert (der_norbert)


Lesenswert?

Ralf X. schrieb:
> Viel Spass mit einer wörtlichen Übersetzung eines aktuellen Textes aus
> traditionellem chinesisch.

Geht aber nicht um eine Übersetzung. Schon gar nicht um die stark 
symbolische Darstellung chinesischen Textes.

Es geht um die Erkennung und korrekte Wiedergabe von Buchstaben im 
ASCII- Bereich. Nicht deren Interpretation.

Weshalb wird bei ›Rabrunsel‹ das ›r‹ unterschlagen und zu ›Rabunsel‹ 
gewandelt? An anderer Stelle wird ein ›r‹ ja offensichtlich korrekt 
erkannt.

Weshalb wird aus einem korrekten ›herauf‹ ein ›hinauf‹?

Wieso glaub das System bei der Interpretation, dass man etwas zum ›Tor‹ 
und nicht zum ›Turm‹ hinauf ruft?

von Harald K. (kirnbichler)


Lesenswert?

Norbert schrieb:
> Wieso glaub das System bei der Interpretation, dass man etwas zum ›Tor‹
> und nicht zum ›Turm‹ hinauf ruft?

Da steht "Torm". Mit "o". Und das ist so ungebräuchlich, daß die 
Fehlerkorrektur daraus ein "Tor" macht.

Die Fehlerkorrektur weiß nichts von der Mundart, die der Text 
wiedergibt, und fällt deswegen auf die Fresse.

von Norbert (der_norbert)


Lesenswert?

Harald K. schrieb:
> Da steht "Torm".

Da es sich um eine Interpretation handelt, sollte doch – wenn man etwas 
hinauf ruft – ganz klar dem Turm und nicht dem Tor Vorrang gegeben 
werden.

Harald K. schrieb:
> Die Fehlerkorrektur weiß nichts von der Mundart, die der Text
> wiedergibt, und fällt deswegen auf die Fresse.

Deshalb soll sie es sein lassen. So etwas kann man selbst viel besser.

von Jens G. (jensig)


Lesenswert?

Norbert schrieb:
> Weshalb wird aus einem korrekten ›herauf‹ ein ›hinauf‹?
>
> Wieso glaub das System bei der Interpretation, dass man etwas zum ›Tor‹
> und nicht zum ›Turm‹ hinauf ruft?

Dichterische Freiheit ...

von Ein T. (ein_typ)


Lesenswert?

Christoph db1uq K. schrieb:
> Es ift dies die Freiheit der Bäume,
> nach der wir ung ebenfalls
> fo fehr fehnen.
>
> die Schrifterkennung lispelt, das "s" ist ein Problem.

Fo hätte ich daf aber auch gelefen. :-)

von Ein T. (ein_typ)


Lesenswert?

Lu schrieb:
> Karlsson V. schrieb:
>> ChatGPT 5.2 kann das fehlerfrei.
>
> KI kann nur das fehlerfrei, wo vorher ein Muster gelernt wurde.

Ja, aber anders als Du und der Kornpichler glauben. KI ist ziemlich gut 
darin, Zeichen -- zumal gedruckte -- zu erkennen. Darum war der 
MNIST-Datensatz einer der frühesten standardisierten Benchmarks für 
KI-Modelle. Leider ist der Link auf der Webseite von Yann LeCun defekt 
und aktuell finde ich nur diese Quelle [1], bei der allerdings leider 
das TLS-Zertifikat abgelaufen ist.

Fakt ist jedenfalls, daß moderne KI-Modelle diese Aufgabe nicht nur 
wesentlich schneller, sondern auch deutlich besser bewältigen können als 
Menschen.

[1] https://yann.lecun.org/exdb/mnist/

von Abdul K. (ehydra) Benutzerseite


Lesenswert?

Wie wurde denn aus Rapunzels Bart ihr Haar? Bekanntlich hatten damals 
Frauen noch keinen Bart, hm 😆

Ich bin verwirrt.

von Bradward B. (Firma: Starfleet) (ltjg_boimler)


Lesenswert?

> KI ist ziemlich gut
> darin, Zeichen -- zumal gedruckte -- zu erkennen. Darum war der
> MNIST-Datensatz einer der frühesten standardisierten Benchmarks für
> KI-Modelle.

MNIST hat aber Handschrift, nicht Typographie mit  optisch teilweise 
widersprechenden Schriftsätzen wie Fraktur und Antiqua

* https://de.wikipedia.org/wiki/MNIST-Datenbank
* https://de.wikipedia.org/wiki/Fraktur_(Schrift)
* https://de.wikipedia.org/wiki/Antiqua

OCR bediente sich schon lange vor Einführung von ChatGPT der Künstlichen 
Neuronalen Netze, neudeutsch Machine learning. Wenn hier ChatGPT besser 
ausschaut als bspw. gimagereader dann liegt das wohl eher an einem 
fehlerhaften Schritt im Workflow - der Vorgabe oder auch Erkennung des 
als Referenz zu verwendeten Mustersatzes.
gimagereader versucht sich an der Ähnlichkeit des Zeichens für 's' und 
scheitert bei Frakturschrift, da dort das 's' wie ein 'f' ausschaut. Und 
das große 'A' schaut in Fraktur wie das große 'U' aus. Und noch ein paar 
Stolpersteine.

Trainiert man den Imagereader mit  dem tatsächlich benutzten 
Fraktur-Schriftsatz sollte das "lispeln" passé sein.

* https://www.lwl.org/waa-download/pdf/Installation%20OCR%20Software.pdf
* https://forum.ubuntuusers.de/topic/gimagereader-fraktur/

PS:
Ich seh grad, das mit dem 's' in Fraktur ist noch etwas verzwickter, am 
Wortende wird ein Zeichen/Type verwendet, das wie 's' ausschaut, am 
Wortanfang oder mittendrin, das das dem 'f' ähnlich ausschaut.

Das ist fast so verzwickt wie farsi, auch als arabische Schrift 
bezeichnet, da schauen die Zeichen je nach Position im Wort anders aus.

Der Teufel steckt halt im Detail ;-)
(-; شیطان در جزئیات است

: Bearbeitet durch User
von Harald K. (kirnbichler)


Lesenswert?

Bradward B. schrieb:
> und scheitert bei Frakturschrift, da dort das 's' wie ein 'f' ausschaut.

Nicht "das" 's', sondern eines von beiden. Es gibt in der Fraktur 
nämlich auch ein 's', das dem heute gebräuchlichen entspricht. Das 
findet man am Silbenende, das andere hingegen am Beginn oder innerhalb 
einer Silbe.

Siehe: https://de.wikipedia.org/wiki/Langes_s

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.