Mitten im Betrieb ist mein 12.04 plötzlich hängen geblieben - der
Mauszeiger ließ sich noch bewegen, aber das wars dann auch.
Nach einem Reset wurde noch das Luks-Paßwort abgefragt und dann blieb er
in der Ram-Disk hängen. Das Verhalten ist reproduzierbar.
Als nächstes habe ich auf die 10.04-Platte umgeschaltet und gebootet.
Ein Versuch, die 12.04-Platte zu mounten scheitert nach Abfrage des
Luks-Paßwortes mit der Fehlermeldung im Anhang.
dmesg zeigt folgende Meldungen dazu:
Hallo,
ich würde zuerst einmal die S.M.A.R.T Parameter der Festplatte auslesen.
So bekommst Du einen ersten Eindruck, ob Du es mit einem Software oder
Hardwareproblem zu tun hast. Unter Windows verwende ich hierfür die
Portable Edition von CrystalDiskInfo.
Das SATA-Kabel hast Du vermutlich schon einmal abgezogen und wieder
aufgesteckt? Wirkt manchmal wunder.
Mit freundlichen Grüßen
Guido
Es scheint ein kaputter Sektor im ext4-Journal zu sein.
Ich habe jetzt mal ein /cp /dev/mapper/lx6-root /dev/null/ angekickt -
er liest wacker...
Versuche, das mapper-Device als ext2 zu mounten scheitern.
SMART zeigt keine Fehler.
Das cp /dev/mapper/lx6-root /dev/null habe ich abgebrochen und
stattdessen ein cp /dev/sdb /dev/null laufen gelassen. Das stürzt mit
derselben Sektornummer ab, wie der Mountversuch. dmesg-Ausgabe im
Anhang.
Ein beherztes sudo fsck /dev/mapper/lx6-root hats wieder grade gebogen,
die Platte läßt sich unter 10.04 wieder mounten. Es kam eine Latte
Meldungen und ich hoffe, die 12.04 läßt sich auch wieder booten:
1
$ sudo fsck /dev/mapper/lx6-root
2
fsck from util-linux-ng 2.17.2
3
e2fsck 1.41.11 (14-Mar-2010)
4
/dev/mapper/lx6-root: recovering journal
5
Error reading block 60338071 (Attempt to read block from filesystem resulted in short read). Ignore error<y>? yes
Du das ist wirklich ein defekter Sektor auf der Platte.
Du kannst ja badblock im Lesen-Modus laufen lassen, wenn das dann auch
einen Fehler aus gibt, schmeiß die Platte weg.
Uhu Uhuhu schrieb:> Die Möhre läuft wieder...
lass zur sicherheit mal einen selbsttest über die platte laufen.
aus dem package "smartmontools" (o.ä. kann sein das es in deiner distri
anders heißt)
1
smartctl --test=long /dev/sdb
wenn der selftest fertig ist (läuft im hintergrund), so nach einer bis
einigen stunden, kannst du mit
1
smartctl --all /dev/sdb
schauen obs unbehebbare probleme gibt und du dir eine neue platte
besorgen solltest. backup hast du, oder?
Klaus Wachtler schrieb:> ausgeschaltet, ohne zu umounten?
das ist dem device copy egal. das versucht nicht das möglicherweise
fehlerhafte dateisystem zu lesen sondern die sektoren der platte (wobei
ein dd oder dd_rescue schöner gewesen wäre - bei "cp /dev/sdb" rollen
sich mir die fußnägel :)
@ Uhu Uhuhu (uhu)
So erstelle ich mein komprimiertes Backup.
Beim der Home-Partition wäre der Copy Befehl vielleicht besser gewesen
als die ganze Partition zu sichern. Da die leeren Bereiche nicht
wirklich leer sind wurde die 25 GByte Partition, bei der nur 900MByte
belegt sind auf 2.5 GByte komprimiert. (das ausnullen des freien
Bereichs würde somit Speicherplatz im Image sparen, ist aber
komplizierter)
Klaus Wachtler schrieb:> ausgeschaltet, ohne zu umounten?
Wenn die Kiste hängt, kann man das schlecht. Außer dem Mauszeiger hat
sich nichts bewegt und Plattenaktivitäten konnte man zumindest keine
sehen, als ich reset gedrückt habe.
c. m. schrieb:> bei "cp /dev/sdb" rollen sich mir die fußnägel :)
Wieso? ich habe den Beweis bekommen, daß die Platte prinzipiell noch
funktioniert. Was hinter dem defekten Sektor los ist, bekommt man damit
natürlich nicht raus, aber eine erste Aussage über die Sektoren davor
bekommt man.
Christian Berger schrieb:> Du kannst ja badblock im Lesen-Modus laufen lassen, wenn das dann auch> einen Fehler aus gibt, schmeiß die Platte weg.
Wegen einem defekten Sektor auf einer 500 GB Platte wäre das etwas
übertrieben. Das Thema steht erst an, wenn sich solche Fisimatenden
wiederholen.
Mike J. schrieb:> So erstelle ich mein komprimiertes Backup.
Datensicherung mache ich mit rdiff-backup. Das ist sowas ähnliches, wie
svn & Co. für Dateisysteme: der aktuelle Stand ist direkt zugreifbar,
für die älteren Versionen werden reverse deltas gespeichert.
SMART zeigt interessanterweise einen einzigen Lesefehler, keinen
Schreibfehler und keine Reallokationen an. Ebenso keine unbehebbaren
Fehler.
Laufzeit ist laut SMART ~5700 Stunden.
Uhu Uhuhu schrieb:> Klaus Wachtler schrieb:>> ausgeschaltet, ohne zu umounten?>> Wenn die Kiste hängt, kann man das schlecht. Außer dem Mauszeiger hat> sich nichts bewegt und Plattenaktivitäten konnte man zumindest keine> sehen, als ich reset gedrückt habe.
War ja kein Vorwurf, aber nach meiner Erfahrung ein nicht seltener
Grund.
Hatte aber dabei nicht auf dem Schirm, daß das sektorweise Kopieren ja
auch scheiterte. Damit ist es natürlich ein HW-Problem.
Es gibt übrigens eine Spezialversion von dd (dd-rescue), die bei Fehlern
einzelner Sektoren nicht kleinlich ist und wenigstens den Rest dahinter
kopiert.
Damit kann man gelegentlich noch etwas retten, wenn man auf die Kopie
dann ein fsck los lässt.
Das hatte ich auch mal, Linux fährt hoch und der Bildschirm bleibt
schwarz, ich konnte nichts sehen und nicht in auf eine Konsole
umschalten.
Man konnte den Power Knopf drücken, es gab etwas Festplattenaktivität
und ist dann sauber runtergefahren.
rdiff-backup schau ich mir mal an.
Uhu Uhuhu schrieb:> badblocks im Lesemodus hat nichts gefunden, die SMART-Fehlerdaten haben> sich nicht geändert. Das war wohl ein behebbarer Sektorfehler.
Wenn du ein komplettes Backup hast und die Maschine evtl per LIVE System
booten kannst, empfehle ich wärmstens badblocks im non-destructive write
mode durchlaufen zu lassen.
'man 8 badblocks' kennt die Parameter.
Damit bleiben die Daten erhalten und die komplette Plattenoberfläche(n)
wird einmal 'magnetisch durchgeknetet'.
Wirkt wie eine Frischzellenkur und erlaubt der eingebauten
Festplattenlogik auch Sektoren zu erkennen, die zwar (gerade) noch
lesbar sind aber vielleicht schon beim nächsten Schreiben Probleme
verursachen könnten. Damit können sie problemlos reallokiert/'umgemappt'
werden.
Das habe ich von nicht all zu langer Zeit schonmal gemacht, bevor ich
das 12.04 drauf gezogen habe.
Ich habe jetzt mal den ausführlichen SMART-Test angeworfen.
Uhu Uhuhu schrieb:> Ich habe jetzt mal den ausführlichen SMART-Test angeworfen.
NUR vom Testen ist noch keine HD gesünder geworden. In ungünstigen
Fällen ist diese HD in wenigen Stunden ganz krank. Davor solltest Du die
wichtigen Ordner gesichert haben.
Ich hatte ein paar mal den Fall (bei verschiedenen PCs) dass die
Festplatte kurz ausgesetzt hat, dabei noch kurz irgend einen Mist
geschrieben hat und dann weiter lief, man konnte Windows nicht mehr
bedienen.
Nach einem Neustart gab es dann irgend welche Fehler, die Festplatte
wurde mit Scandisk überprüft und etwas wieder her gestellt.
Der Grund lag hier immer an einem ausgenuddelten Stecker (nicht die
S-ATA Stromstecker die sind scheinbar besser) vom Netzteil, da saß ein
Kontakt etwas locker.
Das bedeutet: Hoher Kontaktwiderstand + bei geringen Vibrationen der
Lüfter muss sich da etwas verändert haben.
Inzwischen hab ich dort andere Steckkontakte verwendet. (Kabel an der
Festplatte angelötet)