KeyFC欢迎致辞,点击播放
资源、介绍、历史、Q群等新人必读
KeyFC 社区总索引
如果你找到这个笔记本,请把它邮寄给我们的回忆
KeyFC 漂流瓶传递活动 Since 2011
 

[硬盘专家Misha座谈] 为了减少不必要的眼泪...(必读0楼)

[ 17178 查看 / 45 回复 ]

硬盘S.M.A.R.T.信息读取程序,能够预先检测出硬盘出现故障的征兆...
建议大家隔一段时间就用一下,以达到减少不必要的眼泪的效果。

http://smartmontools.sourceforge.net/

* Windows程序下载 *

使用方法:
* 下载,解压,放在一个方便的地方
* 打开命令行: "开始" - "运行" - "cmd"(回车)
* cd /D <刚才解压的文件的路径的 bin 目录>

* 运行 smartctl -a <设备标识>
  <设备标识>: 一般只有一个硬盘的机器就是: /dev/hda
  (没错,Windows下也是这样写,因为这个程序是从Linux下移植过来的,保留了Linux的一些特征)

接下来仔细对照以下各项S.M.A.R.T.记录的意义:
一般来说,各项的 RAW Value 越低越好,具体意义如下。

颜色标识(重要性): 关键  一般  参考

Raw Read Error Rate          底层读取错误率,高值暗示盘体/磁头有问题
Throughput Performance        读写通量性能 (越高越好)
                              * 一般在进行了人工 Offline S.M.A.R.T. 测试以后才会有值。
Spin Up Time                  电机起转时间,单位为秒或者毫秒
Start/Stop Count              电机起停次计数,高值暗示故障概率增加
Reallocated Sector Count      重定位扇区计数,表示硬件已经发现了多少坏扇区
                              * 理想情况下这个值应该为0,如果不为0也不要太惊慌,而是应该比较密切的关注这个值的变化情况:
                                如果连续几周没有变化,那你应该可以放心的继续使用比较长的一段时间;
                                如果这个值持续攀升,那么请尽快备份所有数据,并考虑购买新硬盘。
Seek Error Rate              寻道错误率,这个视硬盘厂家而定,有的厂新硬盘都会有
                              * 一般不为零也不要紧,但是如果持续升高,暗示盘体/磁头机械有问题。
Seek Time Performance        寻道性能 (越高越好),如果持续减低,暗示盘体/磁头机械有问题
Power-On Hours                磁盘加电时间。
                              * 参考磁盘厂家给的该款硬盘的 MTBF(平均故障间隔时间) 可以估计故障概率。
                                但是也有可能超过MTBF而不会出现故障,因为统计数据对于个体来说是不精确的...-v-
Spin Retry Count              电机起转重试,理想情况应该为0,非0表示电机或者控制芯片可能存在问题
                              * 当然,在某些情况下可能认为造成这个值的非故障升高,比如电压供给不足。
Recalibration Retries        磁头校准重试,高值暗示磁头机械有问题
Device Power Cycle Count      设备开关计数,高值暗示故障概率增加
Soft Read Error Rate          软件读取错误率,高值暗示有扇区不稳定
G-Sense Error Rate            加速度错误率
                              * 一般存在于笔记本硬盘和企业级硬盘中,表示硬盘受到的可能导致故障的冲击次数。
Power-Off Retract Count      电源关闭磁头收回计数
Load/Unload Cycle Count      磁头升降计数
Temperature                  硬盘温度记录,如果显示历史最高温度过高,可以认为暗示故障概率增加
                              * 具体温度极限参考硬盘厂家各款硬盘的技术指标。
Reallocation Events Count    重定位事件计数,记录已经进行的重定位,和可能进行重定位的扇区的数目
                              * 这个计数就包含了上次读操作有错误的不稳定扇区。如果下次这些扇区读操作无错误,这个值可能减少。
Current Pending Sector Count  等候重定的扇区计数,记录了不稳定的扇区的数量
                              * 这些扇区目前仍然可以读取,但是如果下一个写操作发生错误,硬盘就会产生一个扇区重定位操作:
                                将这个扇区标记为坏扇区,并使用备用扇区替代;同时,重定位扇区计数(Reallocated Sector Count)增加,这个值减少。
Uncorrectable Sector Count    无法校正的扇区计数,记录肯定出错的扇区数量
                              * 这些扇区目前已经不能读取,如果有文件使用这些扇区,则操作系统会返回读取错误;
                                当下一次写操作发生时硬盘会对扇区自动重定位;同时,重定位扇区计数(Reallocated Sector Count)增加,这个值减少。
UltraDMA CRC Error Count      UDMA通讯CRC错误,记录硬盘通讯时发生的CRC错误
                              * 如果这个值不为0,而且继续增加,则表示 硬盘控制器-数据线-硬盘接口 有错误发生。
Write (Multi-Zone) Error Rate 写错误发生率,这个视硬盘厂家而定,有的厂新硬盘都会有
                              * 一般不为零也不要紧,但是如果持续快速升高,暗示盘体/磁头机械有问题。
Disk Shift                    盘体偏移,通常由强烈的撞击或坠落造成... -_-|||

*** 一般来说,大家只要注意红色的记录看上去正常,那么硬盘将来一段时间一般就不会有什么问题。
*** 似乎有的硬盘厂家的盘(好像是WD)一开始用就有 Raw Read Error, Seek Error 和 Write Error,如果这样的话,那么这个值就可以被忽略,只要Reallocate Sector没有,就可以视为好盘。
分享 转发
飛べない翼に、意味はあるんでしょうか?
TOP

回复:[硬盘专家Misha座谈] 为了减少不必要的眼泪...(必读0楼)

比如我这块硬盘的S.M.A.R.T.值就如下:

ID# ATTRIBUTE_NAME          FLAG    VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate    0x000b  100  100  062    Pre-fail  Always      -      0          <--很好
  2 Throughput_Performance  0x0005  100  100  040    Pre-fail  Offline      -      0          <--Offline才获取的数据,因为从来没做过,所以没有
  3 Spin_Up_Time            0x0007  250  250  033    Pre-fail  Always      -      2          <--正常
  4 Start_Stop_Count        0x0012  100  100  000    Old_age  Always      -      221        <--电机起停次数,安装Windows的硬盘一般不会因为长时间没有动静停转,因此应该和 Power Cycle Count 差不多
  5 Reallocated_Sector_Ct  0x0033  100  100  005    Pre-fail  Always      -      0          <--很好
  7 Seek_Error_Rate        0x000b  100  100  067    Pre-fail  Always      -      0          <--很好
  8 Seek_Time_Performance  0x0005  100  100  040    Pre-fail  Offline      -      0          <--Offline才获取的数据,因为从来没做过,所以没有
  9 Power_On_Hours          0x0012  088  088  000    Old_age  Always      -      5687      <--快八个月了...买来以后基本没有关过 -_-b
10 Spin_Retry_Count        0x0013  100  100  060    Pre-fail  Always      -      0          <--很好
12 Power_Cycle_Count      0x0032  100  100  000    Old_age  Always      -      194        <--重启动次数...因为以前装的Windows有一点Bug,正常情况下大约每40个小时需要重启一次... -_-|||
191 G-Sense_Error_Rate      0x000a  100  100  000    Old_age  Always      -      0          <--很好
192 Power-Off_Retract_Count 0x0032  100  100  000    Old_age  Always      -      9          <--再次印证我说的: 基本没有关过机 -v-
193 Load_Cycle_Count        0x0012  100  100  000    Old_age  Always      -      9166      <--笔记本硬盘没事经常这样,正常...
194 Temperature_Celsius    0x0002  122  122  000    Old_age  Always      -      45 (Lifetime Min/Max 10/53) <--笔记本硬盘,一般80度以下没问题
196 Reallocated_Event_Count 0x0032  100  100  000    Old_age  Always      -      1          <--有一个弱磁道,对于100G硬盘,不算怪事
197 Current_Pending_Sector  0x0022  100  100  000    Old_age  Always      -      1          <--还没有被Reallocate,表示似乎还有救 -v-|||
198 Offline_Uncorrectable  0x0008  100  100  000    Old_age  Offline      -      0          <--Offline才获取的数据,因为从来没做过,所以没有
199 UDMA_CRC_Error_Count    0x000a  200  253  000    Old_age  Always      -      0          <--没问题
飛べない翼に、意味はあるんでしょうか?
TOP

回复:[硬盘专家Misha座谈] 为了减少不必要的眼泪...(必读0楼)

来一块老硬盘的-v-

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG    VALUE WORST THRESH TYPE      UPDATED
FAILED RAW_VALUE
  1 Raw_Read_Error_Rate    0x000f  054  048  006    Pre-fail  Always
      204497565
  3 Spin_Up_Time            0x0003  098  098  000    Pre-fail  Always
      0
  4 Start_Stop_Count        0x0032  100  100  020    Old_age  Always
      476
  5 Reallocated_Sector_Ct  0x0033  100  100  036    Pre-fail  Always
      37
  7 Seek_Error_Rate        0x000f  084  060  030    Pre-fail  Always
      269715693
  9 Power_On_Hours          0x0032  091  091  000    Old_age  Always
      8287
10 Spin_Retry_Count        0x0013  100  100  097    Pre-fail  Always
      0
12 Power_Cycle_Count      0x0032  099  099  020    Old_age  Always
      1822
194 Temperature_Celsius    0x0022  038  043  000    Old_age  Always
      38
195 Hardware_ECC_Recovered  0x001a  054  048  000    Old_age  Always
      204497565
197 Current_Pending_Sector  0x0012  100  100  000    Old_age  Always
      6
198 Offline_Uncorrectable  0x0010  100  100  000    Old_age  Offline
      6
199 UDMA_CRC_Error_Count    0x003e  200  200  000    Old_age  Always
      0
200 Multi_Zone_Error_Rate  0x0000  100  253  000    Old_age  Offline
      0
202 TA_Increase_Count      0x0032  096  249  000    Old_age  Always
      4


我的妈妈呀……囧
TOP

回复:[硬盘专家Misha座谈] 为了减少不必要的眼泪...(必读0楼)

AVC把命令行窗口的宽度调整一下,这样能够一行显示全... -v-
飛べない翼に、意味はあるんでしょうか?
TOP

回复:[硬盘专家Misha座谈] 为了减少不必要的眼泪...(必读0楼)

1 Raw_Read_Error_Rate    0x000f  054  048  006    Pre-fail  Always
      204497565


严重怀疑此类数值为溢出所致-v-
TOP

回复:[硬盘专家Misha座谈] 为了减少不必要的眼泪...(必读0楼)

再来一块

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG    VALUE WORST THRESH TYPE      UPDATED  WHEN_
FAILED RAW_VALUE
  1 Raw_Read_Error_Rate    0x000b  100  100  032    Pre-fail  Always      -
      130534
  2 Throughput_Performance  0x0005  100  100  020    Pre-fail  Offline      -
      0
  3 Spin_Up_Time            0x0007  096  090  025    Pre-fail  Always      -
      1
  4 Start_Stop_Count        0x0012  093  093  016    Old_age  Always      -
      3889
  5 Reallocated_Sector_Ct  0x0033  100  100  024    Pre-fail  Always      -
      0
  7 Seek_Error_Rate        0x000b  100  100  020    Pre-fail  Always      -
      2799
  8 Seek_Time_Performance  0x0005  100  100  019    Pre-fail  Offline      -
      0
  9 Power_On_Seconds        0x0012  042  042  020    Old_age  Always      -
      8757h+52m+25s
10 Spin_Retry_Count        0x0013  100  100  020    Pre-fail  Always      -
      0
12 Power_Cycle_Count      0x0032  075  075  020    Old_age  Always      -
      3795
196 Reallocated_Event_Count 0x0033  100  100  024    Pre-fail  Always      -
      0
197 Current_Pending_Sector  0x0010  100  100  020    Old_age  Offline      -
      0
198 Offline_Uncorrectable  0x0010  100  100  020    Old_age  Offline      -
      0
199 UDMA_CRC_Error_Count    0x000a  200  200  197    Old_age  Always      -
      29
200 Multi_Zone_Error_Rate  0x000b  100  007  020    Pre-fail  Always  In_th
e_past 1934


怎么又……
我的妈妈呀……囧
TOP

回复:[硬盘专家Misha座谈] 为了减少不必要的眼泪...(必读0楼)

似乎有的硬盘厂家的盘(好像是WD)一开始用就有 Raw Read Error, Seek Error 和 Write Error,如果这样的话,那么这个值就可以被忽略,只要Reallocate Sector没有,就可以视为好盘。
飛べない翼に、意味はあるんでしょうか?
TOP

回复:[硬盘专家Misha座谈] 为了减少不必要的眼泪...(必读0楼)

汗阿/。/

ID# ATTRIBUTE_NAME          FLAG    VALUE WORST THRESH TYPE      UPDATED  WHEN_
FAILED RAW_VALUE
  1 Raw_Read_Error_Rate    0x0029  100  100  020    Pre-fail  Offline      -
      0
  3 Spin_Up_Time            0x0027  080  079  020    Pre-fail  Always      -
      2541
  4 Start_Stop_Count        0x0032  098  098  008    Old_age  Always      -
      1547
  5 Reallocated_Sector_Ct  0x0033  100  100  020    Pre-fail  Always      -
      0
  7 Seek_Error_Rate        0x000b  100  093  023    Pre-fail  Always      -
      0
  9 Power_On_Hours          0x0012  086  086  001    Old_age  Always      -
      9790
10 Spin_Retry_Count        0x0026  100  100  000    Old_age  Always      -
      0
11 Calibration_Retry_Count 0x0013  100  100  020    Pre-fail  Always      -
      0
12 Power_Cycle_Count      0x0032  098  098  008    Old_age  Always      -
      1530
13 Read_Soft_Error_Rate    0x000b  100  100  023    Pre-fail  Always      -
      0
194 Temperature_Celsius    0x0022  083  079  042    Old_age  Always      -
      44
195 Hardware_ECC_Recovered  0x001a  100  100  000    Old_age  Always      -
      2722276<---这到底是什么—v—b
196 Reallocated_Event_Count 0x0010  100  100  020    Old_age  Offline      -
      0
197 Current_Pending_Sector  0x0032  100  100  020    Old_age  Always      -
      0
198 Offline_Uncorrectable  0x0010  100  253  000    Old_age  Offline      -
      0
199 UDMA_CRC_Error_Count    0x001a  200  200  000    Old_age  Always      -
      0
比大海更深沉的忧伤,比天空更青蓝的悠远。
TOP

回复:[硬盘专家Misha座谈] 为了减少不必要的眼泪...(必读0楼)

Hardware_ECC_Recovered  <--- 读扇区时使用ECC纠正了错误
这个问题不大,有的硬盘会出现比较大的值,我记得是Seagate和Maxtor

总之,只要红色的项目没有值或者很小,就没有问题。
飛べない翼に、意味はあるんでしょうか?
TOP

回复:[硬盘专家Misha座谈] 为了减少不必要的眼泪...(必读0楼)

都试了一下.......

(1)
ID# ATTRIBUTE_NAME          FLAG    VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0027  191  190  063    Pre-fail  Always      -      22617
  4 Start_Stop_Count        0x0032  253  253  000    Old_age  Always      -      738
  5 Reallocated_Sector_Ct  0x0033  207  207  063    Pre-fail  Always      -      470
  6 Read_Channel_Margin    0x0001  253  253  100    Pre-fail  Offline      -      0
  7 Seek_Error_Rate        0x000a  253  252  000    Old_age  Always      -      0
  8 Seek_Time_Performance  0x0027  251  244  187    Pre-fail  Always      -      65364
  9 Power_On_Minutes        0x0032  232  232  000    Old_age  Always      -      967h+47m
10 Spin_Retry_Count        0x002b  253  252  157    Pre-fail  Always      -      0
11 Calibration_Retry_Count 0x002b  253  252  223    Pre-fail  Always      -      0
12 Power_Cycle_Count      0x0032  252  252  000    Old_age  Always      -      709
192 Power-Off_Retract_Count 0x0032  253  253  000    Old_age  Always      -      0
193 Load_Cycle_Count        0x0032  253  253  000    Old_age  Always      -      0
194 Temperature_Celsius    0x0032  253  253  000    Old_age  Always      -      48
195 Hardware_ECC_Recovered  0x000a  253  252  000    Old_age  Always      -      11255
196 Reallocated_Event_Count 0x0008  253  253  000    Old_age  Offline      -      0
197 Current_Pending_Sector  0x0008  253  253  000    Old_age  Offline      -      0
198 Offline_Uncorrectable  0x0008  253  253  000    Old_age  Offline      -      0
199 UDMA_CRC_Error_Count    0x0008  198  195  000    Old_age  Offline      -      4
200 Multi_Zone_Error_Rate  0x000a  253  252  000    Old_age  Always      -      0
201 Soft_Read_Error_Rate    0x000a  253  252  000    Old_age  Always      -      6
202 TA_Increase_Count      0x000a  253  103  000    Old_age  Always      -      0
203 Run_Out_Cancel          0x000b  253  252  180    Pre-fail  Always      -      3
204 Shock_Count_Write_Opern 0x000a  253  240  000    Old_age  Always      -      0
205 Shock_Rate_Write_Opern  0x000a  253  252  000    Old_age  Always      -      0
207 Spin_High_Current      0x002a  253  252  000    Old_age  Always      -      0
208 Spin_Buzz              0x002a  253  252  000    Old_age  Always      -      0
209 Offline_Seek_Performnce 0x0024  198  198  000    Old_age  Offline      -      0
99 Unknown_Attribute      0x0004  253  253  000    Old_age  Offline      -      0
100 Unknown_Attribute      0x0004  253  253  000    Old_age  Offline      -      0
101 Unknown_Attribute      0x0004  253  253  000    Old_age  Offline      -      0

---------------------------------------------------------------------------------------------------

(2)
ID# ATTRIBUTE_NAME          FLAG    VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  3 Spin_Up_Time            0x0027  204  202  063    Pre-fail  Always      -      15563
  4 Start_Stop_Count        0x0032  253  253  000    Old_age  Always      -      476
  5 Reallocated_Sector_Ct  0x0033  253  253  063    Pre-fail  Always      -      0
  6 Read_Channel_Margin    0x0001  253  253  100    Pre-fail  Offline      -      0
  7 Seek_Error_Rate        0x000a  253  252  000    Old_age  Always      -      0
  8 Seek_Time_Performance  0x0027  253  246  187    Pre-fail  Always      -      36485
  9 Power_On_Minutes        0x0032  237  237  000    Old_age  Always      -      140h+06m
10 Spin_Retry_Count        0x002b  253  252  157    Pre-fail  Always      -      0
11 Calibration_Retry_Count 0x002b  253  252  223    Pre-fail  Always      -      0
12 Power_Cycle_Count      0x0032  252  252  000    Old_age  Always      -      472
192 Power-Off_Retract_Count 0x0032  253  253  000    Old_age  Always      -      0
193 Load_Cycle_Count        0x0032  253  253  000    Old_age  Always      -      0
194 Temperature_Celsius    0x0032  253  253  000    Old_age  Always      -      46
195 Hardware_ECC_Recovered  0x000a  253  252  000    Old_age  Always      -      10039
196 Reallocated_Event_Count 0x0008  253  253  000    Old_age  Offline      -      0
197 Current_Pending_Sector  0x0008  253  253  000    Old_age  Offline      -      0
198 Offline_Uncorrectable  0x0008  253  253  000    Old_age  Offline      -      0
199 UDMA_CRC_Error_Count    0x0008  199  199  000    Old_age  Offline      -      0
200 Multi_Zone_Error_Rate  0x000a  253  252  000    Old_age  Always      -      0
201 Soft_Read_Error_Rate    0x000a  253  252  000    Old_age  Always      -      0
202 TA_Increase_Count      0x000a  253  252  000    Old_age  Always      -      0
203 Run_Out_Cancel          0x000b  253  252  180    Pre-fail  Always      -      0
204 Shock_Count_Write_Opern 0x000a  253  252  000    Old_age  Always      -      0
205 Shock_Rate_Write_Opern  0x000a  253  252  000    Old_age  Always      -      0
207 Spin_High_Current      0x002a  253  252  000    Old_age  Always      -      0
208 Spin_Buzz              0x002a  253  252  000    Old_age  Always      -      0
209 Offline_Seek_Performnce 0x0024  193  192  000    Old_age  Offline      -      0
99 Unknown_Attribute      0x0004  253  253  000    Old_age  Offline      -      0
100 Unknown_Attribute      0x0004  253  253  000    Old_age  Offline      -      0
101 Unknown_Attribute      0x0004  253  253  000    Old_age  Offline      -      0

---------------------------------------------------------------------------------------------------

(3)
ID# ATTRIBUTE_NAME          FLAG    VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate    0x000f  060  050  006    Pre-fail  Always      -      200399897
  3 Spin_Up_Time            0x0003  096  096  000    Pre-fail  Always      -      0
  4 Start_Stop_Count        0x0032  100  100  020    Old_age  Always      -      83
  5 Reallocated_Sector_Ct  0x0033  100  100  036    Pre-fail  Always      -      0
  7 Seek_Error_Rate        0x000f  072  060  030    Pre-fail  Always      -      15987836
  9 Power_On_Hours          0x0032  099  099  000    Old_age  Always      -      1359
10 Spin_Retry_Count        0x0013  100  100  097    Pre-fail  Always      -      0
12 Power_Cycle_Count      0x0032  100  100  020    Old_age  Always      -      83
194 Temperature_Celsius    0x0022  034  044  000    Old_age  Always      -      34 (Lifetime Min/Max 0/11)
195 Hardware_ECC_Recovered  0x001a  060  050  000    Old_age  Always      -      200399897
197 Current_Pending_Sector  0x0012  100  100  000    Old_age  Always      -      0
198 Offline_Uncorrectable  0x0010  100  100  000    Old_age  Offline      -      0
199 UDMA_CRC_Error_Count    0x003e  200  200  000    Old_age  Always      -      0
200 Multi_Zone_Error_Rate  0x0000  100  253  000    Old_age  Offline      -      0
202 TA_Increase_Count      0x0032  100  253  000    Old_age  Always      -      0

---------------------------------------------------------------------------------------------------

第一块的 Reallocated_Sector_Ct 好高………… ||||||||
第一块看上去不怎么乐观.....
请问是这样吗……? orz
TOP