Forum: PC Hard- und Software Dateiformat, Texdatei, Unicode Probleme


von Info (Gast)


Lesenswert?

Umlaute und Sonderzeichen werden in einer als UTF-8 codierten Textdatei 
mit BOM in HEX Form angezeigt (Geany, Notepad++): z.B: "xDF" für 'ß'

Wodurch ist das Problem entstanden und wie kann ich das beheben?

von Info (Gast)


Lesenswert?

Nachtrag: "Suchen und Ersetzen" funktinoiert mit diesen Zeichen mit NP++ 
nicht, Geany schafft es einmal, aber die Zeichen lassen sich nicht aus 
dem Suchen-Feld entfernen (auch nightly build nicht).

von Info (Gast)


Lesenswert?

Mhh. gedit verhält sich genau umgekehrt zu den beiden anderen 
Programmen.
Die oben erwähnte Datei wird fehlerfrei dargestellt, eine andere Datei 
mit demselben Encoding wird dagegen z.B. mit "für" angezeigt.

von Info (Gast)


Lesenswert?

Dieses Perl-Skript http://plasmasturm.org/log/416/ löst das Problem:
1
cat infile | repair-utf8.pl > outfile

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.