Forum: PC Hard- und Software Datenverlust auf XFS-Partition auf NVME-SSD


von Christian S. (uhrenfreak)


Lesenswert?

Hallo Forum!

Bei Datenverlusten kommt ja immer der schadenfreudige Kommentar "Wenn du 
kein Backup hast, waren deine Daten nicht wichtig!". Bitte erspart euch 
das, ich bin schon frustriert genug. Da ist möglicherweise Arbeit von 
Monaten weg.

Es geht um Folgendes: Ein ganzer Ordner ist weg auf einer XFS-Partition, 
genauer Zeitpunkt des Verschwindens unbekannt, wahrscheinlich letzte 
Woche Donnerstag. Sonst ist die Partition aber augenscheinlich in 
Ordnung!
Dateisystemfehler halte ich deswegen für wenig wahrscheinlich.
Der Ordner könnte versehentlich verschoben worden sein, "sudo find / .." 
findet aber rein gar nichts von den fehlenden Sachen.
Unabsichtliches Löschen könnte auch passiert sein. Es gibt ein 
Tcl-Skript "xfs_undelete". Es hat aber den Nachteil, dass die Dateinamen 
nicht erhalten bleiben. Da wird eine Menge unidentifizierbarer Müll 
gefunden. Es sieht aber so aus, wenn man nach Zeitraum selektiert sucht, 
dass ebenfalls nichts von den vermissten Sachen gefunden wird.
Ich werde mir morgen mal das Programm xfs_repair angucken.
Die Partition wird ansonsten nicht so beansprucht und hat viel freien 
Speicher. Es ist nämlich die getrennt gehaltene Partition für /home.

Kann das auch ein Hardwareproblem sein? Die NVME-SSD ist ein neueres 
Modell (im September 2022 gekauft) mit 1GB von Samsung.
Können da irgendwelche wearleveling-Prozesse oder 
overprovisioning-Strategien versagt haben? Wahrscheinlich war ja dieser 
eine wichtige Ordner auch der mit den meisten Schreibzugriffen.

OS ist CentOS 7, Kernel ist 3.10.0.-1160.88.1.el7x86_64. CentOS müssen 
wir leider wegen einer bestimmen Vorgabe auf der Arbeit benutzen.
Irgendwelche Missverständisse aufgrund von Mountpoint-Verschiebungen 
oder komischen systemd-Sachen halte ich auch für möglich. Ich hab da 
aber grad Tomaten auf den Augen.

Alles ist da - nur der eine wichtige Ordner nicht!

Jegliche Hinweise sind willkommen!
Schönen Abend noch!

Christian

von Irgend W. (Firma: egal) (irgendwer)


Lesenswert?

Christian S. schrieb:
> Kann das auch ein Hardwareproblem sein? Die NVME-SSD ist ein neueres
> Modell (im September 2022 gekauft) mit 1GB von Samsung.
> Können da irgendwelche wearleveling-Prozesse oder
> overprovisioning-Strategien versagt haben? Wahrscheinlich war ja dieser
> eine wichtige Ordner auch der mit den meisten Schreibzugriffen.

Kannst du eigentlich ausschließen. Die SSD weiß nicht wirklich was von 
Ordnern und Dateien. Das kennt eher nur Hardware-Sectoren/-Blocks und 
die müssen nicht identisch sein mit dem was das Filesystem so macht. 
Noch dazu besteht eine Datei ja quasi aus zwei Teilen (ggf. drei). Dem 
Eintrag mit den Metadaten, z.B. wie die Datei heißt und wo die Daten im 
Filesystem beginnt usw.. Wenn es dir also dort was zerschossen hätte, 
dann wäre das nicht exakt auf einen Filesystem-Ordner beschränkt, da 
hättest du richtig Datensalat (deshalb kann "undelete" da meist auch 
keine Dateinamen mehr herstellen, selbst wenn es die Nutz-Daten noch 
findet).
Wenn es dir einen Datenblock zerschossen hätte, wäre die Datei für dich 
immer noch ganz normal "sichtbar", erst beim Versuch auf diese 
zuzugreifen kommt dann der Datensalat zu tage.

-https://www.ufsexplorer.com/de/articles/storage-technologies/xfs-file-system/

"Use df to check File System" and "Repairing a XFS File System with 
xfs_repair"
- https://landoflinux.com/linux_xfs_filesystem_introduction.html

Aber, bevor man nochmal irgendwie schreibend auf so einer Platte 
rumeiert, Backup erstellen (ab besten vollständiges 1:1 Image der 
gesamten Partition)! Jeder Schreibzugriff reduziert die 
Wahrscheinlichkeit das du überhaupt nochmal irgendwas restaurieren 
kannst.

von Motopick (motopick)


Lesenswert?

Es ist immer eine gute Idee, sich rechtzeitig mit dem passenden
Filesystemdebugger vertraut zu machen.
Bei xfs haette ich schon Zweifel ob es den ueberhaupt gibt.
Und man muss sich auch ein wenig mit den Internas des Filesystems
beschaeftigen.

In deinem Fall hoffe ich mal, dass du jedwede weitere Dateioperation
beim Bemerken des Verlustes auf der SSD unterlassen hast.
Das steigert die Erfolgschancen naemlich wesentlich.

In meinem Fallbeispiel war eine 800 MB grosse Datei in einem
gut benutzten Filesystem "abhanden" gekommen.
Die "Leiche" mit dem Filesystemdebugger zu finden und wieder
herzustellen war in wenigen Minuten erledigt...
Die Datei war auch noch nicht korrumpiert worden.

Viel Erfolg!

von Stefan P. (form)


Lesenswert?

Christian S. schrieb:
> Es ist nämlich die getrennt gehaltene Partition für /home

Klingt jetzt komisch, aber:
Hast Du mal unmounted und dann in /home nachgesehen?
Vielleicht wurden die Daten ja geschrieben als die Platte gar nicht 
mounted war, und durch das nachträgliche drüber-mounten wird es nun 
"ausgeblendet".

von Christian S. (uhrenfreak)


Lesenswert?

Aah, ich verstehe, du meinst, dass versteckt hinter dem mit zugehöriger 
Partition gemounteten /home noch ein Order /home liegt, der auf / 
angelegt wurde?

Irgenwie ist das ein ganz heißer Hinweis! Ich gucke gleich nach. Vielen 
Dank schonmal!

von Εrnst B. (ernst)


Lesenswert?

Unbedingt beachten: undelete & co können nur helfen, wenn die Daten noch 
irgendwo auf der SSD stehen. Sobald da einmal ein discard drübergelaufen 
ist, sind die aber unwiederbringlich weg.
Also: Sicherstellen dass die Mount-Option "discard" nicht gesetzt ist, 
und dass kein cronjob/systemd-timer mit "fstrim" läuft.

von Christian S. (uhrenfreak)


Lesenswert?

Vielen Dank für erste an alle Hinweisgeber.

Der Vorschlag von Stefan P. mit dem obendrüber gemounteten /home war es 
leider nicht. Wäre zu schön gewesen.
xfs_repair habe ich mal aufgerufen, da kam dann eine Fehlermeldung, 
danach ließ sich die Partition nicht mehr mounten. Es ist aber so extrem 
komisch, dass am Anfang genau ein Ordner fehlte und sonst nichts.
Ich habe jetzt mittels Knoppix-Stick gebootet und die gesamte SSD mit dd 
auf eine externe Festplatte dupliziert. Ich muss später dann mal in Ruhe 
gucken, ob man wenigstens mit xfs_repair die Mount-barkeit der Partition 
wieder herstellen kann.

Viele Grüße Christian

von Daniel A. (daniel-a)


Lesenswert?


von Jörg E. (jackfritt)


Lesenswert?

Evtl photorec drüberlaufen lassen. Hat mir schon oft den A gerettet. 
Keine Ahnung ob das Dateisystem unterstützt wird.

von Motopick (motopick)


Lesenswert?

> xfs_repair habe ich mal aufgerufen, da kam dann eine Fehlermeldung,
> danach ließ sich die Partition nicht mehr mounten.

Ich hoffe mal, du hast die Fehlermeldung notiert.

Ueblicherweise greifen Filesystemdebugger zunaechst nur lesend zu,
und man muss Schreiboperationen explizit erlauben.
Wenn bereits der Lesezugriff Veraendungen am Filesystem bewirkt hat,
hiesse das, dass die interne Verwaltung der SSD einen Schaden hat.

Geht auch ein Read-Only-Mount nicht mehr?

von (prx) A. K. (prx)


Lesenswert?

Was für eine SSD ist es?
Aktuelle Firmware?

: Bearbeitet durch User
von Christian S. (uhrenfreak)


Lesenswert?

Der SSD-Typ ist Samsung 980, Firmware kann ich gerade nicht nachgucken.
Kann man die Firmware bei diesem Gerät ohne Datenverlust updaten?
Aber es war hier schon so eine Art Übereinkunft dass die SSD-Hardware 
eher nicht das Problem ist, sondern eher bewusstes Löschen/Verschieben 
oder XFS-Probleme.

Der xcd-Comic ist schon leider zutreffend.

Es ist auch so, dass es nicht meine Daten sind, die weg sind.
Ich bin sowieso nur Linux-Anwender, nicht Administrator.
Eine andere Person der Arbeitsgruppe hatte mich um Hilfe gebeten.
Manche Schritte der Person waren auch nicht so hilfreich, z. B. den 
gelöschten Ordner mit demselben Namen wieder neu anzulegen und mit Daten 
zu füllen.
Das ist aber passiert, nachdem ich den Rechner ausgeschaltet und hier im 
Forum gefragt hatte.
Glaube ich zumindest.

Dann kommen noch so komische Sachen dazu, die CentOS geschuldet sind.
Die Person hat den Installer defaultmäßig durchlaufen lassen. Dadurch 
sind alle Partitionen in so einem CentOS-Volume-Mapper oder so.
Wenn ich den Installer starte, schalte ich diesen Volume-Mapper immer 
ab,
so dass dann einfach

nvme0n1p2 auf / gemountet ist und

nvme0n1p3 auf /home gemountet

Und die default-Einstellung für XFS als Dateisystem ändere ich auch 
immer auf ext4 ab. Es ist frustrierend, dass xfs_undelete prinzipiell 
keine Dateinamen kennt. photorec ja auch nicht. xfs kenne ich sowieso 
fast überhaupt nicht.

Auf einem privaten Rechner hatte ich mal versehentlich eine wichtige 
Datei (mit viel Arbeitsstunden drin) gelöscht. Ausgeschaltet als ich es 
gemerkt habe, mit Knoppix gebootet, ext4_undelete ausgeführt, ohne 
Probleme wiederhergestellt.

Ich weiß jetzt noch nicht, was ich jetzt mit der Spiegelung mache und ob 
ich Zeit dafür habe.

von Frank K. (fchk)


Lesenswert?

Christian S. schrieb:
> Der SSD-Typ ist Samsung 980, Firmware kann ich gerade nicht nachgucken.

Lies das:
https://www.heise.de/news/Samsung-SSD-980-Pro-Wichtiges-Firmware-Update-behebt-Defektursache-7477812.html

> Kann man die Firmware bei diesem Gerät ohne Datenverlust updaten?
ja. Hast Du eine der betroffenen Exemplare, solltest Du nicht zögern. 
Wäre sonst doof.

fchk

von (prx) A. K. (prx)


Lesenswert?

Christian S. schrieb:
> Aber es war hier schon so eine Art Übereinkunft dass die SSD-Hardware
> eher nicht das Problem ist, sondern eher bewusstes Löschen/Verschieben
> oder XFS-Probleme.

Kontrolle ist besser als Vertrauen.

Bei der 980 Pro wärs in jedem Fall dringend angesagt, denn die hatte vor 
dem letzten Update dieses Jahr extreme Alterung durch einen 
Firmware-Bug.

: Bearbeitet durch User
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.