Reallocated_Sector_Ct – Trügerischer Smart-Wert

Heute fiel mir auf einem System im Kernel-Ringbuffer folgendes Problem auf:

[17485760.323906] ata4.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[17485760.323948] ata4.00: irq_stat 0x40000001
[17485760.323963] ata4.00: failed command: READ DMA EXT
[17485760.323986] ata4.00: cmd 25/00:00:80:f0:59/00:04:15:00:00/e0 tag 0 dma 524288 in
[17485760.323990] res 51/40:f0:70:f2:59/00:01:15:00:00/e0 Emask 0x9 (media error)
[17485760.324057] ata4.00: status: { DRDY ERR }
[17485760.324070] ata4.00: error: { UNC }
[17485760.333361] ata4.00: configured for UDMA/133
[17485760.333414] sd 3:0:0:0: [sdb] Unhandled sense code
[17485760.333420] sd 3:0:0:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[17485760.333428] sd 3:0:0:0: [sdb] Sense Key : Medium Error [current] [descriptor]
[17485760.333438] Descriptor sense data with sense descriptors (in hex):
[17485760.333444] 72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
[17485760.333462] 15 59 f2 70
[17485760.333471] sd 3:0:0:0: [sdb] Add. Sense: Unrecovered read error - auto reallocate failed
[17485760.333484] sd 3:0:0:0: [sdb] CDB: Read(10): 28 00 15 59 f0 80 00 04 00 00
[17485760.333501] end_request: I/O error, dev sdb, sector 358216304
[17485760.333561] ata4: EH complete

Ein kurzer Smart-Durchlauf liefert folgende trügerische Informationen:

SMART overall-health self-assessment test result: PASSED

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 3 Short offline Completed without error 00% 10042 -

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 099 099 036 Pre-fail Always - 58

In Fett markiert sieht man jedoch den eigentlichen Wert (Raw Value) das heißt, es wurden bereits 58 defekte Sektoren auf der Platte erkannt und durch Reserve-Sektoren ersetzt. Dieser hohe Wert von 58 macht sich auch bei der Performance bemerkbar – jedesmal muss beim Lesen/Schreiben eines defekten Sektors zum Ersatzsektor gesprungen werden.

Höchste Zeit also, die Platte zu tauschen.