“SMART使用属性:194 Temperature_Celsius从146更改为150”。 这是在CentOS 6.6上。
这是什么意思? 驱动器真的很热,或者这可能是一个软件错误? 该驱动器是一个eSATA 2TB驱动器,触摸感觉很酷,位于地下室的服务器是70F。
# smartctl -A /dev/sdb smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-504.16.2.el6.x86_64] (local build) Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000b 100 100 016 Pre-fail Always - 0 2 Throughput_Performance 0x0005 134 134 054 Pre-fail Offline - 89 3 Spin_Up_Time 0x0007 123 123 024 Pre-fail Always - 507 (Average 505) 4 Start_Stop_Count 0x0012 100 100 000 Old_age Always - 89 5 Reallocated_Sector_Ct 0x0033 100 100 005 Pre-fail Always - 0 7 Seek_Error_Rate 0x000b 100 100 067 Pre-fail Always - 0 8 Seek_Time_Performance 0x0005 135 135 020 Pre-fail Offline - 26 9 Power_On_Hours 0x0012 096 096 000 Old_age Always - 29541 10 Spin_Retry_Count 0x0013 100 100 060 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 71 192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 205 193 Load_Cycle_Count 0x0012 100 100 000 Old_age Always - 205 **194 Temperature_Celsius 0x0002 150 150 000 Old_age Always - 40 (Min/Max 20/49)** 196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0 197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x000a 200 200 000 Old_age Always - 9
这只是SMART属性值。 这不是任何常规单位的温度。 (它更像是255(真的很冷)和0(真的很热)之间的一个数字,取决于驱动器是什么热和什么不)
如果您想查看驱动器的温度,请使用smartctl -A /dev/sdx
你会得到像这样的表格:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 194 Temperature_Celsius 0x0022 107 097 000 Old_age Always - 45
RAW_VALUE就是你要找的东西…(我的驱动器在45°C时很温暖)
VALUE是属性值,当它低于THRESH ,驱动器正准备要求更换。 (并不是所有的属性都有阈值,就像我的温度一样)
关于什么是热的,什么不是热的,这真的取决于驱动力。 谷歌在驱动器故障率方面有一些过时的文章 ,指出40°C左右的驱动器故障率最低(至less在谷歌和2007年)。 我记得读过另外一篇论文(现在找不到),说明高温不是硬盘的问题。 急剧频繁的温度变化可能会导致磁盘快速失效。 所以只要驱动温度非常稳定(你可以使用像munin这样的东西来监视),你应该没问题。
smartd正在报告任何属性的变化。 这并不意味着有什么不妥。