Forum: PC Hard- und Software Smartphone: Umlaute werden als "?" dargestellt


von Gustav K. (hauwech)


Lesenswert?

Hallo,

eine 2012 gespeicherte HTML-Seite zeigt mir auf dem Samsung S5 sämliche 
Umlaute als ? an. Auf dem PC unter MSIE, FF, Opera ist dies nicht so. 
Allerdings wird eine aktuelle gespeicherte Seite auf dem S5 richtig 
angezeigt.

Wo liegt der Hund begraben?

Gustav

: Bearbeitet durch User
von Ein T. (ein_typ)


Lesenswert?

Gustav K. schrieb:
> Wo liegt der Hund begraben?

Der Zeichensatz (charset oder character set) ist falsch, den kannst Du 
im HTTP-Header vom Server setzen oder im HTML-Head.

von Max M. (jens2001)


Lesenswert?

Gustav K. schrieb:
> Auf dem PC unter MSIE, FF, Opera

Gustav K. schrieb:
> auf dem Samsung S5
Unter ????????????????

von Gustav K. (hauwech)


Lesenswert?

Max M. schrieb:
> Unter ????????????????

Öffnen der Datei mit "HTML-Anzeige" wurde mir angeboten und erschien mir 
passend.

Nachtrag: Sehe eben, dass der Inhalt der Seite nur zwischen <body> und 
</body> steht. Da fehlt offensichtlich was.

: Bearbeitet durch User
von Markus L. (rollerblade)


Lesenswert?

Samsung geht wohl hartnäckig von UTF-8 codiertem HTML aus, das 
vermutlich aber in ISO8859 vorliegt. MSIE, FF, Opera sind da wohl 
"flexibler" und erkennen, daß das HTML in ISO8859 codiert ist.

von Gustav K. (hauwech)


Angehängte Dateien:

Lesenswert?

Habe die Seite nun durch Hinzufügen von <html>, <head> und <title> 
komplettiert, wie in Selfhtml dargestellt. Konkret:
1
<!doctype html>
2
<html lang="de">
3
  <head>
4
    <meta charset="utf-8">
5
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
6
    <title>Text</title>
7
  </head>
8
  <body>Inhalt</body>
9
</html>
Was die Seite nun komplett unbrauchbar macht :-(

Ich sehe nun auch unter MSIE, FF und Opera keine Umlaute mehr und auf 
dem S5 hat sich nichts verändert. Bild 1 zeigt die Umlaute unter FF und 
Windows, Bild 2 unter FF und Ubuntu. So wie in Bild 2 werden die Umlaute 
auch auf dem S5 dargestellt. In Bild 3 lasse ich mir unter FF und Ubuntu 
den Quelltext anzeigen. Bereits hier werden mir die Umlaute nicht mehr 
angezeigt ???

Benenne ich *.htm in *.txt um, sehe ich die Umlaute wie üblich.
Jetzt blicke ich nicht mehr durch :-(

von Hmmm (hmmm)


Lesenswert?

Gustav K. schrieb:
> <meta charset="utf-8">

Das ist ja auch ISO-8859-1 (alternativ -15, wird aber nur fürs 
Euro-Symbol gebraucht) und eben kein UTF-8.

von Gustav K. (hauwech)


Lesenswert?

Markus L. schrieb:
> Samsung geht wohl hartnäckig von UTF-8 codiertem HTML aus, das
> vermutlich aber in ISO8859 vorliegt. MSIE, FF, Opera sind da wohl
> "flexibler" und erkennen, daß das HTML in ISO8859 codiert ist.

So scheint es zu sein, denn mit ISO8859 stimmt nun unter MSIE, FF und 
Opera alles wieder. Nicht aber bei Samsung.

Für die Alben in der Galerie gibt es offensichtlich ein 120 Dateien 
Limit, denn danach bleibt hier unter Ubuntu zuverlässig die Übertragung 
stehen. Dann tauchen die Ordner der HTML-Dateien in der Galerie auf und 
so weiter. Nach derart viel Theater habe ich das Speichern von 
HTML-Dateien verworfen.

Überhaupt klappt das Sortieren von Bildern mittels Zeitstempel nur bei 
jpg Dateien. Hat man in seinem Album zusätzlich Bilder in anderen 
Bildformaten (gif, png, bmp) oder Videos, klappt das mit dem Sortieren 
nicht mehr. Hier hat es geholfen, den Zeitstempel der jpg Dateien zu 
entfernen, dann sortiert das S5 zuverlässig in der Reihenfolge der 
Übertragung.

von Sebastian W. (wangnick)


Lesenswert?

Gustav K. schrieb:
> Benenne ich *.htm in *.txt um, sehe ich die Umlaute wie üblich.
> Jetzt blicke ich nicht mehr durch :-(

Und warum speicherst du die HTML-Datei nicht einfach als UTF-8?

LG, Sebastian

von Klaus H. (klummel69)


Lesenswert?

Gustav K. schrieb:
> Für die Alben in der Galerie gibt es offensichtlich ein 120 Dateien
> Limit, denn danach bleibt hier unter Ubuntu zuverlässig die Übertragung
> stehen. ....
> Überhaupt klappt das Sortieren von Bildern mittels Zeitstempel nur bei
> jpg Dateien.

Erklär mal was du da machst. Mit welcher Software übertragst Du die 
Dateien? Und was haben die jpg mit den html zu tun?

von Hmmm (hmmm)


Lesenswert?

Gustav K. schrieb:
> So scheint es zu sein, denn mit ISO8859 stimmt nun unter MSIE, FF und
> Opera alles wieder. Nicht aber bei Samsung.

Versuch's mal zusätzlich mit dieser Zeile:

<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">

: Bearbeitet durch User
von Steve van de Grens (roehrmond)


Lesenswert?

Gustav K. schrieb:
1
<!doctype html>

Bist du sicher, das das so richtig ist? Ich kenne das eher so:
1
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">

von Hmmm (hmmm)


Lesenswert?

Steve van de Grens schrieb:
> Bist du sicher, das das so richtig ist? Ich kenne das eher so

Weil Du kein HTML5 kennst.

https://www.w3.org/QA/2002/04/valid-dtd-list.html

von Steve van de Grens (roehrmond)


Angehängte Dateien:

Lesenswert?

Hmmm schrieb:
> https://www.w3.org/QA/2002/04/valid-dtd-list.html

OK, aber da ist DOCTYPE groß geschrieben. Vielleicht ist das wichtig.

Ich finde es allerdings fragwürdig, keine HTML Version anzugeben. Die 
dahinter stehende Annahme, dass alle Versionen ab 5.0 immer zueinander 
kompatibel sein werden finde ich ziemlich naiv. Als hätten wir damit 
keine Erfahrung aus der Vergangenheit. Naja, so ist das jetzt halt. Gut, 
dass das nicht meine Idee war. Ich wasche meine Hände in Unschuld.

Mir fällt da gerade was ein: Hatten wir nicht erst vor kurzem die 
Diskussion, dass ISO8859-1 in HTML 5 nicht mehr zulässig ist? Jupp, wird 
prompt vom W3C Check moniert.

: Bearbeitet durch User
von Gustav K. (hauwech)


Lesenswert?

Klaus H. schrieb:
> Erklär mal was du da machst. Mit welcher Software übertragst Du die
> Dateien?

Keine Software. Einfach beide Geräte (Notebook und Smartphone) mit dem 
originalen Samsung USB-Kabel verbinden und dann von einem Ordner in den 
anderen Ordner kopieren.

Sebastian W. schrieb:
> Und warum speicherst du die HTML-Datei nicht einfach als UTF-8?

Die betreffende Seite habe ich vor ca. 10 Jahren gespeichert.
Die Seite ist heute nicht mehr im Netz.

Der Hintergrund ist, dass ich einige Projekte (mit allen möglichen 
Dateitypen) auf dem Smartphone haben wollte. Ich dachte, das verhält 
sich wie auf dem Notebook. Dem ist aber nicht so. Also werde ich 
unterwegs weiterhin das Notebook nutzen.

von Harald K. (kirnbichler)


Lesenswert?

Gustav K. schrieb:
> Sebastian W. schrieb:
>> Und warum speicherst du die HTML-Datei nicht einfach als UTF-8?
>
> Die betreffende Seite habe ich vor ca. 10 Jahren gespeichert.
> Die Seite ist heute nicht mehr im Netz.

In einem geeigneten Editor aufmachen, Codierung umstellen, abspeichern.

Fertig.

von ●DesIntegrator ●. (Firma: FULL PALATINSK) (desinfector) Benutzerseite


Lesenswert?

immer wieder interessant, dass sowas immer wieder auftritt.
und dabei haben wir sowenig Zeichen, die wir nutzen.

Ich hatte kürzlich auch wieder eine "[" Klammer in meinem Namen
- war Behördenpost.

Da frage ich mich nach wie vor, wie man das in Sprachen geht,
die überhaupt garkeine lat. Zeichen haben:

कैसे कंप्यूटर सिस्टम में बिना लैटिन अक्षरों के बोले जाने वाले भाषाओं में 
उनकी चिन्हों को प्रोसेस किया जाता है?

அவர்கள் கணினி அமைப்புகள் அந்த கருவிகளைப் பின்னுக்கிறதா?

von Harald K. (kirnbichler)


Lesenswert?

●DesIntegrator ●. schrieb:
> Da frage ich mich nach wie vor, wie man das in Sprachen geht,
> die überhaupt garkeine lat. Zeichen haben:

Auch nicht anders als bei uns. Die verwenden entweder eine 
8-Bit-Codepage, die halt anders aussieht bei uns, oder sie verwenden 
UTF-8.

Früher™ war man halt der Ansicht, mit Varianten von 7-Bit-ASCII 
zurechtzukommen, und es gab mal eine deutsche Ausführung davon, die 
eckige und geschweifte Klammern sowie Backslash und vertikalen Strich 
durch Umlaute ersetzte, und noch ein Zeichen, das ich jetzt nach über 
drei Jahrzehnten vergessen habe, wurde durch das ß ersetzt.

Wenn Du also Behördenpost bekommst, in der in Deinem Namen eine "[" 
auftaucht, ist damit ein 'Ä' gemeint. Das wiederum lässt darauf 
schließen, daß der entsprechende Datensatz irgendwann vor 1995 angelegt 
wurde ...

von Εrnst B. (ernst)


Angehängte Dateien:

Lesenswert?

●DesIntegrator ●. schrieb:
> Da frage ich mich nach wie vor, wie man das in Sprachen geht,
> die überhaupt garkeine lat. Zeichen haben:

Da kennt dann hoffentlich ein freundlicher Post-Mitarbeiter die üblichen 
Fehl-Kodierungen und bastelt aus den handschriftlichen Umlauten etc. 
wieder die richtige Kodierung, hier Kyrillisch...

https://de.wikipedia.org/wiki/Zeichensalat

>> Im Japanischen wird das Problem als
>> Mojibake (japanisch 文字化け, „Buchstabenverwandlung“) bezeichnet,
>> im Russischen als krakosjábry (кракозябры) und im
>> Chinesischen als luànmǎ (亂碼 / 乱码, „wirre Kodierung“).

von Norbert (der_norbert)


Lesenswert?

Harald K. schrieb:
> Früher™ war man halt der Ansicht, mit Varianten von 7-Bit-ASCII
> zurechtzukommen, und es gab mal eine deutsche Ausführung davon, die
> eckige und geschweifte Klammern sowie Backslash und vertikalen Strich
> durch Umlaute ersetzte, und noch ein Zeichen, das ich jetzt nach über
> drei Jahrzehnten vergessen habe, wurde durch das ß ersetzt.

Das war ungefähr zu der Zeit, als wir für die Erbsen-Nadeldrucker noch 
eigene character-set EEPROMs gebastelt und gebrannt hatten, um dem 
Anspruch der Behörden bzw. Gesetzesvorgaben Genüge zu tun. Gleiches für 
die 3270 Terminals.

von Hmmm (hmmm)


Lesenswert?

Harald K. schrieb:
> noch ein Zeichen, das ich jetzt nach über drei Jahrzehnten vergessen
> habe, wurde durch das ß ersetzt.

Das war die Tilde. Und das @ fiel dem § zum Opfer:

https://de.wikipedia.org/wiki/DIN_66003

: Bearbeitet durch User
von Harald K. (kirnbichler)


Lesenswert?

Hmmm schrieb:
> Das war die Tilde. Und das @ fiel dem § zum Opfer:

Danke für die Erinnerung.

Früher war vielleicht das eine oder andere gut, aber auch verdammt viel 
einfach nur schlecht.

von Jens G. (jensig)


Lesenswert?

Harald K. schrieb:
> Wenn Du also Behördenpost bekommst, in der in Deinem Namen eine "["
> auftaucht, ist damit ein 'Ä' gemeint. Das wiederum lässt darauf
> schließen, daß der entsprechende Datensatz irgendwann vor 1995 angelegt
> wurde ...

Tja, scheint EBCDIC zu sein, und man kann sich offensichtlich nicht für 
eine Zeichencodierung entscheiden, und das Zeichen geht durch 
unterschiedliche Zeichensätze ...
Ä und [ teilen sich beide in EBCDIC den Codepoint 0x4A, einmal in 
Codeset 273 (deutsch als Ä), und in 500 (international, aber auch 
speziell Schweiz) als [ ...
Scheint also noch irgendein Mainframe-System zu sein

: Bearbeitet durch User
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.