Forum: PC Hard- und Software Warum bleibt der alte Text im Google Translator?


von Hans L. (holzwurm56)


Lesenswert?

Hallo,
ich habe eine gescannte Bedienungsanleitung in französicher Sprache mit 
einem OCR-Programm in eine PDF-Datei umgewandelt. Ich wollte die Datei 
mit dem Google Onlinetranslator in Deutsch übersetzen. Das funktioniert 
auch,
aber der alte Text bleibt und wird vom deutschen Text überschrieben, so
kann man eigentlich nichts lesen. Weiß jemand was ich da falsch mache?
Bei normalen nicht gescannten PDF-Dateien funktioniert es sehr gut.
Vielen dank für jede Antwort
Hans
von Hmmm (hmmm)


Lesenswert?

Hans L. schrieb:
> Weiß jemand was ich da falsch mache?
> Bei normalen nicht gescannten PDF-Dateien funktioniert es sehr gut.

Deine OCR-Software erzeugt "Sandwich"-PDFs, die sowohl den Originaltext 
als Bild (den siehst Du auf dem Bildschirm) als auch den OCR-Output als 
Text (den sieht die Suchfunktion und auch Google Translate) enthalten.

Eine Möglichkeit wäre, mit der OCR-Software ein reines Text-PDF zu 
erzeugen. Dann sind aber vermutlich auch alle Grafiken weg.

Eine andere Möglichkeit wäre, den Text aus dem Sandwich-PDF per 
Copy&Paste an Google Translate zu verfüttern und das Ergebnis nur als 
Ergänzung zum französischen PDF zu nutzen.
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.