SMART Verständnisfrage

von Bernd K. (prof7bit)

17.09.2016 12:29

Angehängte Dateien:

spin_retry_count_WTF.png
100 KB

Lesenswert?

•

Hallo,

Mir ist klar dass der Restwert dieser Festplatte nun auf 0 gesunken ist, 
aber kann mir jemand helfen wenigstens zu verstehen warum ein Wert von 1 
Fehler bei erlaubten 60 (ist das so?) bereits die Untauglichkeit 
bedeuten soll, nach welcher Logik wird das Rechteck links oben rot 
gefärbt (es kann nicht nur ein Fehler in diesem Tool sein, es muss 
tiefer stecken denn seit gestern warnt mich Windows 7 penetrant alle 10 
Minuten, jedoch ohne nähere Details zu nennen)? Wozu dient der 
angebliche Grenzwert von 60?

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Peter II (Gast)

17.09.2016 12:31

Lesenswert?

•

▲
▼

Bernd K. schrieb:
> gestern warnt mich Windows 7 penetrant alle 10
> Minuten

und was steht in der Warnung?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Bernd K. (prof7bit)

17.09.2016 12:35

Lesenswert?

•

▲
▼

Peter II schrieb:
> Bernd K. schrieb:
>> gestern warnt mich Windows 7 penetrant alle 10
>> Minuten
>
> und was steht in der Warnung?

Daß ein "Festplattenfehler" festgestellt wurde und ich möge dringend 
eine Datensicherung durchführen.

Datensicherung ist sowieso immer aktuell und kauf einer SSD als Ersatz 
nun auch eingeplant, ich will lediglich verstehen warum 1 Retry von 60 
bereits das Aus bedeuten soll oder wie das zu interpretieren ist.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Dirk K. (d-k)

17.09.2016 12:51

Lesenswert?

•

▲
▼

Bernd K. schrieb:
> aber kann mir jemand helfen wenigstens zu verstehen warum ein Wert von 1
> Fehler bei erlaubten 60 (ist das so?) bereits die Untauglichkeit
> bedeuten soll, nach welcher Logik wird das Rechteck links oben rot

Für SMART Werte bedeutet niedriger=schlechter. Zu Beginn war der Wert 
(in Current) mal bei 100/253. D.h. dein Wert ist nicht "ein Fehler" 
sondern richtig übel. Der Wert ist auch keine Anzahl von Fehlern sondern 
eine Bewertung (basierend auf der Anzahl der Fehler). Für manche 
Einträge kann man die wirklichen Fehler am Raw value ablesen.

Beispiel einer meiner Platten:

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       -       0
Spin_Up_Time            0x0007   252   252   025    Pre-fail  Always       -       2000
Start_Stop_Count        0x0032   098   098   000    Old_age   Always       -       2611
Reallocated_Sector_Ct   0x0033   252   252   010    Pre-fail  Always       -       0
Seek_Error_Rate         0x000e   252   252   051    Old_age   Always       -       0
Seek_Time_Performance   0x0024   252   252   015    Old_age   Offline      -       0
Power_On_Hours          0x0032   075   075   000    Old_age   Always       -       12824
Spin_Retry_Count        0x0032   100   100   051    Old_age   Always       -       2
Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1427
G-Sense_Error_Rate      0x0032   252   252   000    Old_age   Always       -       0
Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       252
Temperature_Celsius     0x0022   136   109   000    Old_age   Always       -       34 (Min/Max 14/43)
Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       0
Reallocated_Event_Count 0x0032   252   252   000    Old_age   Always       -       0
Current_Pending_Sector  0x0012   252   252   000    Old_age   Always       -       0
Offline_Uncorrectable   0x0030   252   252   000    Old_age   Offline      -       0
UDMA_CRC_Error_Count    0x0036   200   200   000    Old_age   Always       -       0
Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       1
Soft_Read_Error_Rate    0x0032   252   252   000    Old_age   Always       -       0
Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       231
Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       22


D.h. meine Platte ist 1427 mal eingeschaltet worden (12), hat 12824 
Power on hours (9) und zwei mal ist die Spindel nicht angelaufen wenn 
sie sollte (2), ... .

Dein Tool scheint das aber nicht direkt umzurechnen (ich benutze 
smartmontools unter Linux). Eventuell kannst du den Eintrag anklicken um 
die Fehlerzahl zu bekommen?

Mehr info hier:
https://kb.acronis.com/content/9636
https://kb.acronis.com/content/9110

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Siggi S. (ottonormaloser)

17.09.2016 12:54

Lesenswert?

•

▲
▼

Bernd K. schrieb:
> es kann nicht nur ein Fehler in diesem Tool sein, es muss tiefer stecken

Lagerschaden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von michael_ (Gast)

17.09.2016 13:03

Lesenswert?

•

▲
▼

Oder das Anschlußkabel.
Mach das mal neu.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Oppa (Gast)

17.09.2016 13:05

Lesenswert?

•

▲
▼

"
Attribute ID: 10 (0x0A)

Hard drives, supporting this attribute

Samsung, Seagate, IBM (Hitachi), Fujitsu, Maxtor, Western Digital

Description

Spin Retry Count S.M.A.R.T. parameter indicates the count of retry of 
spin start attempts. This attribute stores a total count of the spin 
start attempts to reach the fully operational speed (under the condition 
that the first attempt was unsuccessful). Spin attempts are counted for 
the entire hard drive's lifetime so far.

What this means is that physical parts of your hard disk could start 
degrading and malfunctioning.

Recommendations

This is a critical parameter. Degradation of this parameter may indicate 
imminent drive failure. Urgent data backup and hardware replacement is 
recommended."


Nix mit 'niedriger gleich schlechter'. Bei einer mechanisch gesunden 
Platte steht der auf Null. Ich würde nach dem Motto "Einmal ist keinmal" 
verfahren aber nicht verwundert sein wenn sie gar nicht mehr anläuft.

Die nervige Windows Warnung ist Selbstschutz von MS für den US Markt. 
Damit keiner auf USD 10^9 oder mehr klagt weil Windows ja nicht gewarnt 
hat und ihm nun ein Riesengeschäft entgangen ist.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Jan H. (j_hansen)

17.09.2016 13:32

Lesenswert?

•

▲
▼

Oppa schrieb:
> Nix mit 'niedriger gleich schlechter'. Bei einer mechanisch gesunden
> Platte steht der auf Null.

Siehe Beitrag von Dirk K.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Dirk K. (d-k)

17.09.2016 13:46

Lesenswert?

•

▲
▼

Oppa schrieb:
> Nix mit 'niedriger gleich schlechter'. Bei einer mechanisch gesunden
> Platte steht der auf Null. Ich würde nach dem Motto "Einmal ist keinmal"
> verfahren aber nicht verwundert sein wenn sie gar nicht mehr anläuft.

Ich poste zwei Links. Du kopiert einen davon hier komplett rein! (Was 
soll das?) Und ignorierst den anderen, der klar erklärt das deine 
Aussage (siehe Zitat oben) komplett falsch ist.

Um dieses Forum ist es einfach nur noch schade.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Bernd K. (prof7bit)

17.09.2016 14:06

Lesenswert?

•

▲
▼

Die Warnmeldung von Windows ist gestern Abend erstmalig aufgetreten, und 
zwar direkt nach einem Reboot nach einem Absturz (beim Spielen 
[ED-Horizons]), danach hab ich ihn runtergefahren, es war schon spät.

Heute Morgen hab ich in gestartet und das Tool installiert um die 
SMART-Werte zu lesen.

Es ist für mich schwer zu glauben daß ich bei diesem einen Reboot 
letzte Nacht die Schwelle (nach unten) gleich um satte 59 Retries 
überschritten habe (denn vor diesem Reboot hat es noch nicht gewarnt), 
ich würde es daher naiverweise so interpretieren daß das gestern der 
allererste Retry überhaupt war und der Zähler nach oben zählt.

Die Platte hat keine anderen Geräusche gemacht als sonst auch, ich glaub 
sie hat sich nichtmal ausgeschaltet nach dem Crash, er hat direkt 
neugebootet.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Siggi S. (ottonormaloser)

17.09.2016 14:08

Lesenswert?

•

▲
▼

michael_ schrieb:
> Oder das Anschlußkabel.
> Mach das mal neu.

Die einfachsten Sachen übersieht man immer.
Läßt sich aber leider nicht überprüfen da man die s.m.a.r.t.-Werte nicht 
zurücksetzen kann.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Smarty (Gast)

17.09.2016 14:19

Angehängte Dateien:

ScreenShot.jpg
470 KB

Lesenswert?

•

▲
▼

Hiermal ein Beispiel für eine Platte ohne Probleme mit CrystalDisk Info:

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Bernd K. (prof7bit)

17.09.2016 14:27

Lesenswert?

•

▲
▼

https://www.reddit.com/r/techsupport/comments/27zu46/toshiba_hard_drive_spin_retry_count_failing/

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Peter M. (r2d3)

17.09.2016 14:44

Lesenswert?

•

▲
▼

Dirk,

vergiss mal die bewerteten Parameter.
Guck mal auf den Rohwert und vergleiche Deinen mit dem Log von Dirk.

Deine Platte läuft vielleicht nachts im Dauerlauf. Irgendwann hat sie 
sich schlafen gelegt und beim hochfahren gab es dann Probleme. Da geht 
der Zähler ganz schnell hoch.

Entweder hatte sie nicht genügend Spannung, weil es ein Problem mit dem 
Netzteil oder dem Kabel gab oder der Motor zieht zuviel Strom 
(vielleicht ein Schmierungsproblem, wie oben gesagt).

Der Reddit-Link könnte darauf hindeuten, dass es ein Serienproblem bei 
der Platte gab.

Warum fragst Du nicht den Hersteller direkt?

Zeit für Datensicherung!

Ansonsten könntest Du die Platte extern an ein Zweitsystem hängen und 
dann den eventuellen schnellen Anstieg des Rohwerts von "Spin Retry 
Count" beobachten.

Laptop-Platten, extern über USB 2.0 angeschlossen, verletzen gerne die 
Spezifikation und ziehen zuviel Strom.
Dann macht die Platte nur noch zyklisch "klack" wenn sie beim Hochfahren 
scheitert - ein hässliches Geräusch und ein Grund, die Platte sofort 
abzuhängen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Bernd K. (prof7bit)

17.09.2016 15:06

Lesenswert?

•

▲
▼

Dirk K. schrieb:
> und zwei mal ist die Spindel nicht angelaufen wenn
> sie sollte (2), ... .

sudo smartctl -A /dev/sda
smartctl 6.5 2016-01-24 r4214 [x86_64-linux-4.4.0-36-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
Raw_Read_Error_Rate     0x000b   100   100   016    Pre-fail  Always       -       0
Throughput_Performance  0x0005   142   142   054    Pre-fail  Offline      -       71
Spin_Up_Time            0x0007   075   075   024    Pre-fail  Always       -       284 (Average 329)
Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       2192
Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
Seek_Time_Performance   0x0005   115   115   020    Pre-fail  Offline      -       34
Power_On_Hours          0x0012   099   099   000    Old_age   Always       -       8554
Spin_Retry_Count        0x0013   001   001   060    Pre-fail  Always   FAILING_NOW 1638425
Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       1448
Power-Off_Retract_Count 0x0032   099   099   000    Old_age   Always       -       2097
Load_Cycle_Count        0x0012   099   099   000    Old_age   Always       -       2097
Temperature_Celsius     0x0002   142   142   000    Old_age   Always       -       42 (Min/Max 14/59)
Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0


Das heißt meine Spindel ist gestern Abend binnen weniger Minuten 
mindestens 1638425 * 59/100 = 966670 Mal nicht angelaufen?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von (prx) A. K. (prx)

17.09.2016 15:20

Lesenswert?

•

▲
▼

Die Rohwerte in SMART sind ein wenig interpretationsbedürftig.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Dirk K. (d-k)

17.09.2016 15:34

Lesenswert?

•

▲
▼

Bernd K. schrieb:
> Dirk K. schrieb:
>
> Das heißt meine Spindel ist gestern Abend binnen weniger Minuten
> mindestens 1638425 * 59/100 = 966670 Mal nicht angelaufen?

Nicht notwendigerweise (eher unwahrscheinlich). Was es sagt ist das die 
Platte, während ihrer Lebenszeit, 1638425 mal versucht hat die Spindel 
anlaufen zu lassen, in Fällen wo die Spindel beim ersten mal nicht 
angelaufen ist. Und es heißt das der Hersteller das "1" schlimm findet.

Ob der lineare Zusammenhang den du da annimmst gegeben ist weiß nur der 
Hersteller. Und da du keine früheren Messungen hast ist der Zeitraum 
auch schwer einzugrenzen.

Zusätzlich ist das in Realität nur was dir dein Programm sagt. 
Theoretisch könnte eine Fehlübertragung zwischen PC und Platte 
stattfinden (SATA Kabel tauschen), die Speicherstelle wo die Platte den 
Counter ablegt könnte von Strahlung umgekippt sein, ein Fehler in der 
Firmware könnte den Wert verändert haben (siehe Reddit Link oben) und 
tausende andere (großteils unwahrscheinliche) Fehler könnten aufgetreten 
sein.

Ich denke die wichtige Frage hier ist ob man der Platte noch trauen 
kann. Meine persönliche Meinung hier ist nein, aber das hängt natürlich 
auch davon ab wie wichtig dir deine Daten sind.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von anmerkender (Gast)

17.09.2016 21:14

Lesenswert?

•

▲
▼

Bernd K. schrieb:
> 194 Temperature_Celsius     0x0002   142   142   000    Old_age   Always
> -       42 (Min/Max 14/59)

Festplatte kühlen, da hält sie länger!
So muss das aussehen:

Dirk K. schrieb:
> 194 Temperature_Celsius     0x0022   136   109   000    Old_age   Always
> -       34 (Min/Max 14/43)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Peter M. (r2d3)

17.09.2016 21:17

Lesenswert?

•

▲
▼

anmerkender,

hast Recht, aber nicht beliebig weit kühlen, siehe auch die 
Google-Studie zur Festplattenlebensdauer, SMART, etc ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von EGS (Gast)

18.09.2016 05:53

Lesenswert?

•

▲
▼

anmerkender schrieb:
> Bernd K. schrieb:
>> 194 Temperature_Celsius     0x0002   142   142   000    Old_age   Always
>> -       42 (Min/Max 14/59)
>
> Festplatte kühlen, da hält sie länger!
> So muss das aussehen:
>
> Dirk K. schrieb:
>> 194 Temperature_Celsius     0x0022   136   109   000    Old_age   Always
>> -       34 (Min/Max 14/43)

Wobei die Temperatur von Dirk grenzwertiger erscheint. Weil:

Dirk: Min/Max 14/43 Ist: 34 Grad sind "nur" 9 Grad Reserve.

Bernd: Min/Max 14/59 Ist: 42 Grad, macht 17 Grad Reserve...

MFG, EGS aus dem sonnigen Mexico...ach nee ist ja mittlerweile dunkel 
aber dennoch warm ?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Matthias S. (Firma: matzetronics) (mschoeldgen)

18.09.2016 08:32

Lesenswert?

•

▲
▼

Die Festplatte ist nahezu ein Jahr Dauerbetrieb gelaufen (8554 Stunden), 
dabei 1448 mal eingeschaltet worden, etwa 600 mal ist sie in den 
Ruhezustand gefahren.
Wenn das eine normale Konsumerplatte ist, sind das schon recht gute 
Werte und sie könnte es hinter sich haben.

Peter M. schrieb:
> siehe auch die
> Google-Studie zur Festplattenlebensdauer, SMART, etc ...

So isses, lest die mal. Festplatten sollten sogar nicht zu kühl laufen, 
eher etwas wärmer. Das mit den knapp über 40 Grad sieht recht gut aus. 
Es gibt jedenfalls keinen direkten Zusammenhang zwischen etwas höheren 
Temperaturen und Festplattenausfällen. Zu kühle Platten fallen etwas 
früher aus - hiess es.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Peter M. (r2d3)

18.09.2016 10:24

Lesenswert?

•

▲
▼

EGS schrieb:

> Wobei die Temperatur von Dirk grenzwertiger erscheint. Weil:
>
> Dirk: Min/Max 14/43 Ist: 34 Grad sind "nur" 9 Grad Reserve.
>
> Bernd: Min/Max 14/59 Ist: 42 Grad, macht 17 Grad Reserve...
>
> MFG, EGS aus dem sonnigen Mexico...ach nee ist ja mittlerweile dunkel
> aber dennoch warm ?

Nix Reserve!
Nein, das sind keine empfohlenen Grenzen der Betriebstemperatur!

Das sind die aufgezeichneten Maxima und Minima.

Die maximale Temperatur der Platte von Dirk betrug 43 Grad, die von 
Bernd betrug 59 Grad.
43 Grad sind unbedenklich.
59 Grad sind schon jenseits aller Grenzwerte.

Leider sagen die Smart-Parameter nichts darüber aus, wie lange die 
Platte so heiß betrieben wurde.

So eine Platte die mit 7200rpm läuft hat alleine deswegen schon eine 
höhere Leistungsaufnahme und wird wärmer.

Bei mir haben selbst langsame Platten einen vorgeschalteten 
120mm-Lüfter, der horizontale über und unter der Platte bläst.

Ich war mal so dumm und habe zwei Platten direkt übereinander im Rechner 
montiert. Die fielen dann beide in einem heißem Sommer aus.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von (prx) A. K. (prx)

18.09.2016 10:31

Lesenswert?

•

▲
▼

Peter M. schrieb:
> Bei mir haben selbst langsame Platten einen vorgeschalteten
> 120mm-Lüfter, der horizontale über und unter der Platte bläst.

In Notebooks auch? ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: SMART Verständnisfrage

von Peter M. (r2d3)

18.09.2016 10:35

Lesenswert?

•

▲
▼

Danke für den Hinweis, im Notebook natürlich nicht. :)
Ich beziehe mich auf Rechner im großen ATX-Gehäuse.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: PC Hard- und Software SMART Verständnisfrage