Discussion:
smartctl und pre-fail
(zu alt für eine Antwort)
Dennis Reinhardt
2009-04-09 01:37:31 UTC
Permalink
Moin,

in Knoppix findet SmartCTL beim Problemrechner meiner Mutter diverse
SMART-Werte mit "Pre-Fail" (hatte vergessen zu speichern welche genau).
Allerdings findet das Samsung-Tool von der UBCD keine Fehler... soll das
so sein? Oder schaut SHDIAG nur die Oberfläche und die Zeiten für Seek
und Spinup/down an und lässt die SMART-Werte links liegen?

Wenn das jemand verifizieren kann schick ich die Platte morgen mal ein.
Was geht schneller? Austausch über Samsung im Rahmen der Garantie oder
über Atelco im Rahmen der Gewährleistung?

Gruß, Dennis
Helmut Hullen
2009-04-09 06:48:00 UTC
Permalink
Hallo, Dennis,
Post by Dennis Reinhardt
in Knoppix findet SmartCTL beim Problemrechner meiner Mutter diverse
SMART-Werte mit "Pre-Fail" (hatte vergessen zu speichern welche
genau). Allerdings findet das Samsung-Tool von der UBCD keine
Fehler... soll das so sein? Oder schaut SHDIAG nur die Oberfläche und
die Zeiten für Seek und Spinup/down an und lässt die SMART-Werte
links liegen?
Schau Dir mal die Links an:

http://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology
http://linuxwiki.de/SmartMonTools
http://www.linux-user.de/ausgabe/2004/10/056-smartmontools/
http://www.linux-magazin.de/heft_abo/ausgaben/2005/10/na_wie_geht_s_uns_denn_heute/
http://wiki.ubuntuusers.de/Festplattenstatus
http://www.dipohl.de/publikationen/anleitung-zu-smartmontools.html
http://www.howtoforge.de/howto/den-zustand-der-festplatte-mit-smartmontools-debian-ubuntu-uberprufen/

Kern (in diesem Fall) könnte sein, dass die "smartmontools" mit
irgendeiner der vielen Meldungen nichts weiter anfangen können, sie aber
trotzdem notieren.

Viele Gruesse!
Helmut
Dennis Reinhardt
2009-04-09 10:02:40 UTC
Permalink
Post by Helmut Hullen
http://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology
http://linuxwiki.de/SmartMonTools
http://www.linux-user.de/ausgabe/2004/10/056-smartmontools/
http://www.linux-magazin.de/heft_abo/ausgaben/2005/10/na_wie_geht_s_uns_denn_heute/
http://wiki.ubuntuusers.de/Festplattenstatus
http://www.dipohl.de/publikationen/anleitung-zu-smartmontools.html
http://www.howtoforge.de/howto/den-zustand-der-festplatte-mit-smartmontools-debian-ubuntu-uberprufen/
Danke! Ich werd gleich nochmal an besagtem Rechner die Werte kopieren.
Hilft vielleicht auch noch weiter.
Post by Helmut Hullen
Kern (in diesem Fall) könnte sein, dass die "smartmontools" mit
irgendeiner der vielen Meldungen nichts weiter anfangen können, sie aber
trotzdem notieren.
Hm, da waren aber definitv Werte die weit oder sogar bei 1 oder 0 von
Threshold-Wert lagen... Das Pre-Fail tauchte da SEHR oft auf. Verglichen
mit meiner Notebookfestplatte...:

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE
UPDATED WHEN_
FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail
Always -
58
3 Spin_Up_Time 0x0007 252 252 025 Pre-fail
Always -
2250
4 Start_Stop_Count 0x0032 100 100 000 Old_age
Always -
626
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail
Always -
8
7 Seek_Error_Rate 0x000e 252 252 051 Old_age
Always -
0
8 Seek_Time_Performance 0x0024 252 252 015 Old_age
Offline -
0
9 Power_On_Hours 0x0032 097 097 000 Old_age
Always -
2090
10 Spin_Retry_Count 0x0032 252 252 051 Old_age
Always -
0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age
Always -
336
191 G-Sense_Error_Rate 0x0032 100 100 000 Old_age Always
-
9436
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always
-
48
194 Temperature_Celsius 0x0022 133 115 000 Old_age Always
-
35 (Lifetime Min/Max 7/41)
195 Hardware_ECC_Recovered 0x001a 100 100 000 Old_age Always
-
8251
196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always
-
0
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always
-
5
198 Offline_Uncorrectable 0x0030 252 252 000 Old_age
Offline -
0
199 UDMA_CRC_Error_Count 0x0036 200 200 000 Old_age Always
-
0
200 Multi_Zone_Error_Rate 0x000a 100 100 000 Old_age Always
-
39
201 Soft_Read_Error_Rate 0x0032 252 252 000 Old_age Always
-
0
223 Load_Retry_Count 0x0032 097 097 000 Old_age Always
-
3348
225 Load_Cycle_Count 0x0032 092 092 000 Old_age Always
-
87348

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining
LifeTime(hours) LBA
_of_first_error
# 1 Short offline Completed: read failure 00% 2082
178
26216

SMART Selective Self-Test Log Data Structure Revision Number (0) should be 1
SMART Selective self-test log data structure revision number 0
Warning: ATA Specification requires selective self-test log data
structure revis
ion number = 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Completed_read_failure [00% left] (0-65535)
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.



Die Platte hat jetzt z.B. auch den SMART-Healthtest mit "PASSED"bestanden.
Post by Helmut Hullen
Viele Gruesse!
Helmut
Gruß, Dennis
Helmut Hullen
2009-04-09 11:45:00 UTC
Permalink
Hallo, Dennis,
Post by Dennis Reinhardt
Post by Helmut Hullen
http://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting
_Technology http://linuxwiki.de/SmartMonTools
http://www.linux-user.de/ausgabe/2004/10/056-smartmontools/
http://www.linux-magazin.de/heft_abo/ausgaben/2005/10/na_wie_geht_s_
uns_denn_heute/ http://wiki.ubuntuusers.de/Festplattenstatus
http://www.dipohl.de/publikationen/anleitung-zu-smartmontools.html
http://www.howtoforge.de/howto/den-zustand-der-festplatte-mit-smartm
ontools-debian-ubuntu-uberprufen/
Danke! Ich werd gleich nochmal an besagtem Rechner die Werte
kopieren. Hilft vielleicht auch noch weiter.
Post by Helmut Hullen
Kern (in diesem Fall) könnte sein, dass die "smartmontools" mit
irgendeiner der vielen Meldungen nichts weiter anfangen können, sie
aber trotzdem notieren.
Hm, da waren aber definitv Werte die weit oder sogar bei 1 oder 0 von
Threshold-Wert lagen... Das Pre-Fail tauchte da SEHR oft auf.
Welche Nummer, mit welcher Bedeutung (die der jeweilige Hersteller
definiert, mitsamt den Werten, die gemeldet werden)?

Viele Gruesse!
Helmut
Dennis Reinhardt
2009-04-10 10:29:44 UTC
Permalink
Post by Helmut Hullen
Welche Nummer, mit welcher Bedeutung (die der jeweilige Hersteller
definiert, mitsamt den Werten, die gemeldet werden)?
Viele Gruesse!
Helmut
Moin!

Ich hab das der Übersichtlichkeit halber mal hierhin kopiert:
http://www.nopaste.org/p/aeXZ24uXjb

So nimmt der Zeilenumbruch es wenigstens nicht auseinander. :)

Sieht das so aus als ob man die Platte einschicken müsste?
In Vista kam es immer wieder vor das das System einfach Denkpausen
machte und von Zeit zu Zeit sich auch nicht mehr booten ließ
wegen kaputter Daten. Die Diagnosetools von Samsung finden aber
keine Fehler, auch Badblocks hat keine Fehler ausgegeben...

Keine Ahnung wie ich rauskriegen soll ob die Platte Schuld ist
oder Hauptplatine/Chipsatz...

Gruß, Dennis
Helmut Hullen
2009-04-10 12:55:00 UTC
Permalink
Hallo, Dennis,
Post by Dennis Reinhardt
Post by Helmut Hullen
Welche Nummer, mit welcher Bedeutung (die der jeweilige Hersteller
definiert, mitsamt den Werten, die gemeldet werden)?
http://www.nopaste.org/p/aeXZ24uXjb
Sorry - das ist nicht übersichtlich.
Das ist nur umfangreich.

Bei meinem System (Slackware) läuft einerseits der "smartd" dauerhaft
mit; gestartet (über "/etc/init.d") per

smartd -l local3 -i 3600

loggt stündlich in "/var/log/local3.log", benutzt dabei "/etc/
smartd.conf"

"/etc/smartd.conf": eigentlich sollte die einzige Option "DEVICESCAN"
reichen; hier habe ich sie ausblenden müssen. Meine S-ATA-Platten werden
per

/dev/sdc -a -d ata -I 190 -I 194 -I 195

usw. eingetragen; bei den Meldungen mit den Nummern 190, 194 und 195 bin
ich recht sicher, dass "smartd" sie nicht sinnvoll interpretiert.

Welche Nummern werden bei Deinem System gemeldet, welche Bedeutung haben
sie nach Auskunft des jeweiligen Plattenherstellers?
Post by Dennis Reinhardt
So nimmt der Zeilenumbruch es wenigstens nicht auseinander. :)
Sieht das so aus als ob man die Platte einschicken müsste?
In Vista kam es immer wieder vor das das System einfach Denkpausen
machte und von Zeit zu Zeit sich auch nicht mehr booten ließ
wegen kaputter Daten. Die Diagnosetools von Samsung finden aber
keine Fehler, auch Badblocks hat keine Fehler ausgegeben...
Keine Ahnung wie ich rauskriegen soll ob die Platte Schuld ist
oder Hauptplatine/Chipsatz...
Gruß, Dennis
Viele Gruesse!
Helmut
Dennis Reinhardt
2009-04-11 01:34:55 UTC
Permalink
Post by Helmut Hullen
Sorry - das ist nicht übersichtlich.
Das ist nur umfangreich.
Ja, dennoch wäre es der Übersichtlichkeit stark abträglich wenn man es
mit 72 Zeichen pro Zeile umbrechen würde... :)
Post by Helmut Hullen
Bei meinem System (Slackware) läuft einerseits der "smartd" dauerhaft
mit; gestartet (über "/etc/init.d") per
Nunja, das Knoppix ist halt nur eine Notlösung. Da lief bisher Vista auf
dem Rechner.
Post by Helmut Hullen
/dev/sdc -a -d ata -I 190 -I 194 -I 195
usw. eingetragen; bei den Meldungen mit den Nummern 190, 194 und 195 bin
ich recht sicher, dass "smartd" sie nicht sinnvoll interpretiert.
Du meinst nun bei dir oder bei meinen Ergebnissen? Bei mir läuft in
Knoppix ja kein smartd, ich ruf das ja über smartctl auf.
Post by Helmut Hullen
Welche Nummern werden bei Deinem System gemeldet, welche Bedeutung haben
sie nach Auskunft des jeweiligen Plattenherstellers?
Steht doch in dem Listing da, oder hast du es dir erst garnicht angesehen?

Ich konnte jedenfalls aber bei Samsung weder ein Factsheet mit
SMART-Infos finden, noch überhaupt eine Info wielange die Platte
Garantie hat. Keine Onlineabfrage.

Gruß, Dennis
Helmut Hullen
2009-04-11 06:15:00 UTC
Permalink
Hallo, Dennis,
Post by Dennis Reinhardt
Post by Helmut Hullen
Bei meinem System (Slackware) läuft einerseits der "smartd"
dauerhaft mit; gestartet (über "/etc/init.d") per
Nunja, das Knoppix ist halt nur eine Notlösung. Da lief bisher Vista
auf dem Rechner.
Post by Helmut Hullen
/dev/sdc -a -d ata -I 190 -I 194 -I 195
usw. eingetragen; bei den Meldungen mit den Nummern 190, 194 und 195
bin ich recht sicher, dass "smartd" sie nicht sinnvoll
interpretiert.
Du meinst nun bei dir oder bei meinen Ergebnissen?
Bei meinem System.
Post by Dennis Reinhardt
Bei mir läuft in Knoppix ja kein smartd, ich ruf das ja über
smartctl auf.
Deshalb habe ich ja empfohlen, den smartd zu starten.
Post by Dennis Reinhardt
Post by Helmut Hullen
Welche Nummern werden bei Deinem System gemeldet, welche Bedeutung
haben sie nach Auskunft des jeweiligen Plattenherstellers?
Steht doch in dem Listing da, oder hast du es dir erst garnicht angesehen?
Zu viele Zeilen. Jeweils Momentaufnahmen. "smartd" liefert besser
verwertbare Informationen.

Viele Gruesse!
Helmut

Christian Dürrhauer
2009-04-09 15:09:11 UTC
Permalink
da das ein wenig Kaffeesatzlesen ist, weiter an die Spezialisten in dchlf.
flup2 dchlf
Post by Dennis Reinhardt
SMART Attributes Data Structure revision number: 16
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE
UPDATED WHEN_
FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 100 100 051 Pre-fail
Always -
58
hier scheinen die Hersteller zu machen, was sie wollen, und kreisen im
Wesentlichen um den Threshold herum.
Post by Dennis Reinhardt
3 Spin_Up_Time 0x0007 252 252 025 Pre-fail
Always -
2250
boah.
Post by Dennis Reinhardt
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail
Always -
8
8 reallozierte Sektoren. Kann normal sein, sollte es aber nicht und schreit
nach Aufmerksamkeit. Beobachten oder austauschen lassen.

Old_age interessiert niemanden so wirklich.
Post by Dennis Reinhardt
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining
LifeTime(hours) LBA
_of_first_error
# 1 Short offline Completed: read failure 00% 2082
178
26216
Hach, wie ich es liebe: Errors found, exit code 0. Blödes Gelumpe. Gerade
von Samsung kommt firmwaremäßig nur Sch****.
Post by Dennis Reinhardt
SMART Selective Self-Test Log Data Structure Revision Number (0) should be 1
SMART Selective self-test log data structure revision number 0
Warning: ATA Specification requires selective self-test log data
structure revis
ion number = 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Completed_read_failure [00% left] (0-65535)
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Die Platte hat jetzt z.B. auch den SMART-Healthtest mit "PASSED"bestanden.
Vergiss sie. Pack einen Zettel mit dem SMART-Daten dazu und schreib, dass
Dein PC ab und an hängt, während die Festplatten-LED dauerhaft leuchtet...
--
mit freundlichen Grüßen/with kind regards
Christian Dürrhauer

If everything seems to be going well, you have obviously overlooked
something.
Loading...