Forum: PC Hard- und Software SMART Verständnisfrage


von Bernd K. (prof7bit)


Angehängte Dateien:

Lesenswert?

Hallo,

Mir ist klar dass der Restwert dieser Festplatte nun auf 0 gesunken ist, 
aber kann mir jemand helfen wenigstens zu verstehen warum ein Wert von 1 
Fehler bei erlaubten 60 (ist das so?) bereits die Untauglichkeit 
bedeuten soll, nach welcher Logik wird das Rechteck links oben rot 
gefärbt (es kann nicht nur ein Fehler in diesem Tool sein, es muss 
tiefer stecken denn seit gestern warnt mich Windows 7 penetrant alle 10 
Minuten, jedoch ohne nähere Details zu nennen)? Wozu dient der 
angebliche Grenzwert von 60?

von Peter II (Gast)


Lesenswert?

Bernd K. schrieb:
> gestern warnt mich Windows 7 penetrant alle 10
> Minuten

und was steht in der Warnung?

von Bernd K. (prof7bit)


Lesenswert?

Peter II schrieb:
> Bernd K. schrieb:
>> gestern warnt mich Windows 7 penetrant alle 10
>> Minuten
>
> und was steht in der Warnung?

Daß ein "Festplattenfehler" festgestellt wurde und ich möge dringend 
eine Datensicherung durchführen.

Datensicherung ist sowieso immer aktuell und kauf einer SSD als Ersatz 
nun auch eingeplant, ich will lediglich verstehen warum 1 Retry von 60 
bereits das Aus bedeuten soll oder wie das zu interpretieren ist.

von Dirk K. (d-k)


Lesenswert?

Bernd K. schrieb:
> aber kann mir jemand helfen wenigstens zu verstehen warum ein Wert von 1
> Fehler bei erlaubten 60 (ist das so?) bereits die Untauglichkeit
> bedeuten soll, nach welcher Logik wird das Rechteck links oben rot

Für SMART Werte bedeutet niedriger=schlechter. Zu Beginn war der Wert 
(in Current) mal bei 100/253. D.h. dein Wert ist nicht "ein Fehler" 
sondern richtig übel. Der Wert ist auch keine Anzahl von Fehlern sondern 
eine Bewertung (basierend auf der Anzahl der Fehler). Für manche 
Einträge kann man die wirklichen Fehler am Raw value ablesen.

Beispiel einer meiner Platten:
1
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
2
  1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       -       0
3
  3 Spin_Up_Time            0x0007   252   252   025    Pre-fail  Always       -       2000
4
  4 Start_Stop_Count        0x0032   098   098   000    Old_age   Always       -       2611
5
  5 Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
6
  7 Seek_Error_Rate         0x000e   252   252   051    Old_age   Always       -       0
7
  8 Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
8
  9 Power_On_Hours          0x0032   075   075   000    Old_age   Always       -       12824
9
 10 Spin_Retry_Count        0x0032   100   100   051    Old_age   Always       -       2
10
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1427
11
191 G-Sense_Error_Rate      0x0032   252   252   000    Old_age   Always       -       0
12
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       252
13
194 Temperature_Celsius     0x0022   136   109   000    Old_age   Always       -       34 (Min/Max 14/43)
14
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       0
15
196 Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
16
197 Current_Pending_Sector  0x0012   252   252   000    Old_age   Always       -       0
17
198 Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
18
199 UDMA_CRC_Error_Count    0x0036   200   200   000    Old_age   Always       -       0
19
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       1
20
201 Soft_Read_Error_Rate    0x0032   252   252   000    Old_age   Always       -       0
21
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       231
22
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       22

D.h. meine Platte ist 1427 mal eingeschaltet worden (12), hat 12824 
Power on hours (9) und zwei mal ist die Spindel nicht angelaufen wenn 
sie sollte (2), ... .

Dein Tool scheint das aber nicht direkt umzurechnen (ich benutze 
smartmontools unter Linux). Eventuell kannst du den Eintrag anklicken um 
die Fehlerzahl zu bekommen?

Mehr info hier:
https://kb.acronis.com/content/9636
https://kb.acronis.com/content/9110

: Bearbeitet durch User
von Siggi S. (ottonormaloser)


Lesenswert?

Bernd K. schrieb:
> es kann nicht nur ein Fehler in diesem Tool sein, es muss tiefer stecken

Lagerschaden.

von michael_ (Gast)


Lesenswert?

Oder das Anschlußkabel.
Mach das mal neu.

von Oppa (Gast)


Lesenswert?

"
Attribute ID: 10 (0x0A)

Hard drives, supporting this attribute

Samsung, Seagate, IBM (Hitachi), Fujitsu, Maxtor, Western Digital

Description

Spin Retry Count S.M.A.R.T. parameter indicates the count of retry of 
spin start attempts. This attribute stores a total count of the spin 
start attempts to reach the fully operational speed (under the condition 
that the first attempt was unsuccessful). Spin attempts are counted for 
the entire hard drive's lifetime so far.

What this means is that physical parts of your hard disk could start 
degrading and malfunctioning.

Recommendations

This is a critical parameter. Degradation of this parameter may indicate 
imminent drive failure. Urgent data backup and hardware replacement is 
recommended."


Nix mit 'niedriger gleich schlechter'. Bei einer mechanisch gesunden 
Platte steht der auf Null. Ich würde nach dem Motto "Einmal ist keinmal" 
verfahren aber nicht verwundert sein wenn sie gar nicht mehr anläuft.

Die nervige Windows Warnung ist Selbstschutz von MS für den US Markt. 
Damit keiner auf USD 10^9 oder mehr klagt weil Windows ja nicht gewarnt 
hat und ihm nun ein Riesengeschäft entgangen ist.

von Jan H. (j_hansen)


Lesenswert?

Oppa schrieb:
> Nix mit 'niedriger gleich schlechter'. Bei einer mechanisch gesunden
> Platte steht der auf Null.

Siehe Beitrag von Dirk K.

von Dirk K. (d-k)


Lesenswert?

Oppa schrieb:
> Nix mit 'niedriger gleich schlechter'. Bei einer mechanisch gesunden
> Platte steht der auf Null. Ich würde nach dem Motto "Einmal ist keinmal"
> verfahren aber nicht verwundert sein wenn sie gar nicht mehr anläuft.

Ich poste zwei Links. Du kopiert einen davon hier komplett rein! (Was 
soll das?) Und ignorierst den anderen, der klar erklärt das deine 
Aussage (siehe Zitat oben) komplett falsch ist.

Um dieses Forum ist es einfach nur noch schade.

von Bernd K. (prof7bit)


Lesenswert?

Die Warnmeldung von Windows ist gestern Abend erstmalig aufgetreten, und 
zwar direkt nach einem Reboot nach einem Absturz (beim Spielen 
[ED-Horizons]), danach hab ich ihn runtergefahren, es war schon spät.

Heute Morgen hab ich in gestartet und das Tool installiert um die 
SMART-Werte zu lesen.

Es ist für mich schwer zu glauben daß ich bei diesem einen Reboot 
letzte Nacht die Schwelle (nach unten) gleich um satte 59 Retries 
überschritten habe (denn vor diesem Reboot hat es noch nicht gewarnt), 
ich würde es daher naiverweise so interpretieren daß das gestern der 
allererste Retry überhaupt war und der Zähler nach oben zählt.

Die Platte hat keine anderen Geräusche gemacht als sonst auch, ich glaub 
sie hat sich nichtmal ausgeschaltet nach dem Crash, er hat direkt 
neugebootet.

von Siggi S. (ottonormaloser)


Lesenswert?

michael_ schrieb:
> Oder das Anschlußkabel.
> Mach das mal neu.

Die einfachsten Sachen übersieht man immer.
Läßt sich aber leider nicht überprüfen da man die s.m.a.r.t.-Werte nicht 
zurücksetzen kann.

von Smarty (Gast)


Angehängte Dateien:

Lesenswert?

Hiermal ein Beispiel für eine Platte ohne Probleme mit CrystalDisk Info:

von Bernd K. (prof7bit)


Lesenswert?


von Peter M. (r2d3)


Lesenswert?

Dirk,

vergiss mal die bewerteten Parameter.
Guck mal auf den Rohwert und vergleiche Deinen mit dem Log von Dirk.

Deine Platte läuft vielleicht nachts im Dauerlauf. Irgendwann hat sie 
sich schlafen gelegt und beim hochfahren gab es dann Probleme. Da geht 
der Zähler ganz schnell hoch.

Entweder hatte sie nicht genügend Spannung, weil es ein Problem mit dem 
Netzteil oder dem Kabel gab oder der Motor zieht zuviel Strom 
(vielleicht ein Schmierungsproblem, wie oben gesagt).

Der Reddit-Link könnte darauf hindeuten, dass es ein Serienproblem bei 
der Platte gab.

Warum fragst Du nicht den Hersteller direkt?

Zeit für Datensicherung!

Ansonsten könntest Du die Platte extern an ein Zweitsystem hängen und 
dann den eventuellen schnellen Anstieg des Rohwerts von "Spin Retry 
Count" beobachten.

Laptop-Platten, extern über USB 2.0 angeschlossen, verletzen gerne die 
Spezifikation und ziehen zuviel Strom.
Dann macht die Platte nur noch zyklisch "klack" wenn sie beim Hochfahren 
scheitert - ein hässliches Geräusch und ein Grund, die Platte sofort 
abzuhängen.

von Bernd K. (prof7bit)


Lesenswert?

Dirk K. schrieb:
> und zwei mal ist die Spindel nicht angelaufen wenn
> sie sollte (2), ... .
1
sudo smartctl -A /dev/sda
2
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-36-generic] (local build)
3
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
4
5
=== START OF READ SMART DATA SECTION ===
6
SMART Attributes Data Structure revision number: 16
7
Vendor Specific SMART Attributes with Thresholds:
8
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
9
  1 Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
10
  2 Throughput_Performance  0x0005   142   142   054    Pre-fail  Offline      -       71
11
  3 Spin_Up_Time            0x0007   075   075   024    Pre-fail  Always       -       284 (Average 329)
12
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       2192
13
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
14
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
15
  8 Seek_Time_Performance   0x0005   115   115   020    Pre-fail  Offline      -       34
16
  9 Power_On_Hours          0x0012   099   099   000    Old_age   Always       -       8554
17
 10 Spin_Retry_Count        0x0013   001   001   060    Pre-fail  Always   FAILING_NOW 1638425
18
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       1448
19
192 Power-Off_Retract_Count 0x0032   099   099   000    Old_age   Always       -       2097
20
193 Load_Cycle_Count        0x0012   099   099   000    Old_age   Always       -       2097
21
194 Temperature_Celsius     0x0002   142   142   000    Old_age   Always       -       42 (Min/Max 14/59)
22
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
23
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
24
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
25
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0

Das heißt meine Spindel ist gestern Abend binnen weniger Minuten 
mindestens 1638425 * 59/100 = 966670 Mal nicht angelaufen?

von (prx) A. K. (prx)


Lesenswert?

Die Rohwerte in SMART sind ein wenig interpretationsbedürftig.

von Dirk K. (d-k)


Lesenswert?

Bernd K. schrieb:
> Dirk K. schrieb:
>
> Das heißt meine Spindel ist gestern Abend binnen weniger Minuten
> mindestens 1638425 * 59/100 = 966670 Mal nicht angelaufen?

Nicht notwendigerweise (eher unwahrscheinlich). Was es sagt ist das die 
Platte, während ihrer Lebenszeit, 1638425 mal versucht hat die Spindel 
anlaufen zu lassen, in Fällen wo die Spindel beim ersten mal nicht 
angelaufen ist. Und es heißt das der Hersteller das "1" schlimm findet.

Ob der lineare Zusammenhang den du da annimmst gegeben ist weiß nur der 
Hersteller. Und da du keine früheren Messungen hast ist der Zeitraum 
auch schwer einzugrenzen.

Zusätzlich ist das in Realität nur was dir dein Programm sagt. 
Theoretisch könnte eine Fehlübertragung zwischen PC und Platte 
stattfinden (SATA Kabel tauschen), die Speicherstelle wo die Platte den 
Counter ablegt könnte von Strahlung umgekippt sein, ein Fehler in der 
Firmware könnte den Wert verändert haben (siehe Reddit Link oben) und 
tausende andere (großteils unwahrscheinliche) Fehler könnten aufgetreten 
sein.

Ich denke die wichtige Frage hier ist ob man der Platte noch trauen 
kann. Meine persönliche Meinung hier ist nein, aber das hängt natürlich 
auch davon ab wie wichtig dir deine Daten sind.

: Bearbeitet durch User
von anmerkender (Gast)


Lesenswert?

Bernd K. schrieb:
> 194 Temperature_Celsius     0x0002   142   142   000    Old_age   Always
> -       42 (Min/Max 14/59)

Festplatte kühlen, da hält sie länger!
So muss das aussehen:

Dirk K. schrieb:
> 194 Temperature_Celsius     0x0022   136   109   000    Old_age   Always
> -       34 (Min/Max 14/43)

von Peter M. (r2d3)


Lesenswert?

anmerkender,

hast Recht, aber nicht beliebig weit kühlen, siehe auch die 
Google-Studie zur Festplattenlebensdauer, SMART, etc ...

von EGS (Gast)


Lesenswert?

anmerkender schrieb:
> Bernd K. schrieb:
>> 194 Temperature_Celsius     0x0002   142   142   000    Old_age   Always
>> -       42 (Min/Max 14/59)
>
> Festplatte kühlen, da hält sie länger!
> So muss das aussehen:
>
> Dirk K. schrieb:
>> 194 Temperature_Celsius     0x0022   136   109   000    Old_age   Always
>> -       34 (Min/Max 14/43)

Wobei die Temperatur von Dirk grenzwertiger erscheint. Weil:

Dirk: Min/Max 14/43 Ist: 34 Grad sind "nur" 9 Grad Reserve.

Bernd: Min/Max 14/59 Ist: 42 Grad, macht 17 Grad Reserve...

MFG, EGS aus dem sonnigen Mexico...ach nee ist ja mittlerweile dunkel 
aber dennoch warm ?

von Matthias S. (Firma: matzetronics) (mschoeldgen)


Lesenswert?

Die Festplatte ist nahezu ein Jahr Dauerbetrieb gelaufen (8554 Stunden), 
dabei 1448 mal eingeschaltet worden, etwa 600 mal ist sie in den 
Ruhezustand gefahren.
Wenn das eine normale Konsumerplatte ist, sind das schon recht gute 
Werte und sie könnte es hinter sich haben.

Peter M. schrieb:
> siehe auch die
> Google-Studie zur Festplattenlebensdauer, SMART, etc ...

So isses, lest die mal. Festplatten sollten sogar nicht zu kühl laufen, 
eher etwas wärmer. Das mit den knapp über 40 Grad sieht recht gut aus. 
Es gibt jedenfalls keinen direkten Zusammenhang zwischen etwas höheren 
Temperaturen und Festplattenausfällen. Zu kühle Platten fallen etwas 
früher aus - hiess es.

: Bearbeitet durch User
von Peter M. (r2d3)


Lesenswert?

EGS schrieb:

> Wobei die Temperatur von Dirk grenzwertiger erscheint. Weil:
>
> Dirk: Min/Max 14/43 Ist: 34 Grad sind "nur" 9 Grad Reserve.
>
> Bernd: Min/Max 14/59 Ist: 42 Grad, macht 17 Grad Reserve...
>
> MFG, EGS aus dem sonnigen Mexico...ach nee ist ja mittlerweile dunkel
> aber dennoch warm ?

Nix Reserve!
Nein, das sind keine empfohlenen Grenzen der Betriebstemperatur!

Das sind die aufgezeichneten Maxima und Minima.

Die maximale Temperatur der Platte von Dirk betrug 43 Grad, die von 
Bernd betrug 59 Grad.
43 Grad sind unbedenklich.
59 Grad sind schon jenseits aller Grenzwerte.

Leider sagen die Smart-Parameter nichts darüber aus, wie lange die 
Platte so heiß betrieben wurde.

So eine Platte die mit 7200rpm läuft hat alleine deswegen schon eine 
höhere Leistungsaufnahme und wird wärmer.

Bei mir haben selbst langsame Platten einen vorgeschalteten 
120mm-Lüfter, der horizontale über und unter der Platte bläst.

Ich war mal so dumm und habe zwei Platten direkt übereinander im Rechner 
montiert. Die fielen dann beide in einem heißem Sommer aus.

: Bearbeitet durch User
von (prx) A. K. (prx)


Lesenswert?

Peter M. schrieb:
> Bei mir haben selbst langsame Platten einen vorgeschalteten
> 120mm-Lüfter, der horizontale über und unter der Platte bläst.

In Notebooks auch? ;-)

von Peter M. (r2d3)


Lesenswert?

Danke für den Hinweis, im Notebook natürlich nicht. :)
Ich beziehe mich auf Rechner im großen ATX-Gehäuse.

: Bearbeitet durch User
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.