Articles of 智能

Hardware_ECC_Recovered,Seek_Error_rate和Raw_read_error_rate对于磁盘有多糟?

当我在亚马逊买了一台像二手新的10TB磁盘作为备份时,我做了一个聪明的读取,显示磁盘几乎没有被使用。 智能信息很混乱,因为Western Digital Red更容易阅读智能磁盘信息。 这些错误可能会有多糟? *

HGST He8 SMARTtesting扩展自测轮询时间可变性

我最近收到了一批6个全新的HGST He8硬盘,当他们进行最初的长时间自检时,我注意到扩展的自检程序推荐的轮询时间performance出非常大的变化性。 for f in /dev/sd[uz]; do sudo smartctl -i $f | grep "Model"; done Device Model: HGST HUH728080ALN600 Device Model: HGST HUH728080ALN600 Device Model: HGST HUH728080ALN600 Device Model: HGST HUH728080ALN600 Device Model: HGST HUH728080ALN600 Device Model: HGST HUH728080ALN600 for f in /dev/sd[uz]; do sudo smartctl -a $f | grep -A1 "Extended self-test"; done Extended […]

禁用web服务器的smartd服务

我已经在几个地方读过,运行web服务器不需要smartd服务,但是为什么没有解释这是为什么。 为什么当这个服务能够及时地给你即将发生磁盘故障的警告时关掉这个服务是一个好主意?

跳过预定的自检和预测驱动器EOL

几个星期以来,smartd一直在报告说,它周末正在跳过一些预定的自检: 4月24日18:29:32 calvin smartd [4758]:设备:/ dev / sda,跳过预定的离线即时testing; 目前的自检剩余40%。 4月24日18:29:33 calvin smartd [4758]:设备:/ dev / sdb,跳过预定的离线即时testing; 目前的自检剩余50%。 这个RAID-1arrays中的驱动器设置为每天运行四次离线testing,每天凌晨两点进行一次短暂自检,并在周六凌晨两点进行长时间自检。 由于某种原因,看起来长时间的自检时间更长,导致其他计划的testing被跳过。 第一个问题:这是否是一个可能的驱动器故障的迹象? 那么今天,smartd报告说自测失败了。 以下是smartctl -a /dev/sdb的输出: smartctl版本5.38 [i686-pc-linux-gnu]版权所有(C)2002-8布鲁斯·艾伦 主页是http://smartmontools.sourceforge.net/ ===信息部分的开始=== 型号系列:Seagate Barracuda 7200.8系列 器件型号:ST3250823AS 序列号:3ND1GNBC 固件版本:3.03 用户容量:250,059,350,016字节 设备是:在smartctl数据库[详细使用:-P显示] ATA版本是:7 ATA标准是:精确的ATA规范草案版本没有标明 当地时间是:2010年4月25日13:15:34 EDT SMART支持是:可用 – 设备具有SMARTfunction。 SMART支持是:已启用 ===开始读取智能数据部分=== SMART全身健康自我评估testing结果:PASSED 一般SMART值: 离线数据收集状态:(0x82)离线数据收集活动 完成没有错误。 自动离线数据收集:已启用。 自检执行状态:(0)完成上一个自检程序 没有错误或没有自检过 已经运行。 完成离线的总时间 数据收集:(430)秒。 […]

驱动器出现故障,但LSI MegaRAID控制器无法检测到

smartmontools在RAID1configuration中使用的驱动器上报告越来越多的不可读扇区。 我以为LSI MegaRAID控制器也检查其磁盘驱动器的SMART状态,因此应该将驱动器识别为故障,并将其标记为脱机? smartctl -d sat + megaraid输出,7 -a / dev / sda: … 197 Current_Pending_Sector 0x0022 100 100 000 Old_age Always – 69 … Error 11 occurred at disk power-on lifetime: 9704 hours (404 days + 8 hours) When the command that caused the error occurred, the device was active or idle. After command […]

如何获得有关Synology SMART错误的更多信息

我有一个不到一年的3TB希捷Barracuda(ST3000DM001-9YN1),而我的Synology DS1512 +正在报告它为“SMART Status = Abnormal”并告诉我要更换驱动器。 虽然我很欣赏我对即将发生的驱动器故障提出的警告,但是我需要更多的信息来为此硬盘提出保修索赔。 有没有办法获得有关Synology检测到的具体问题的更多信息? smartctl –all / dev / hdb的输出在这里: http ://pastebin.com/raw.php?i=zPw5kvnH

测量外部硬盘的粗暴处理

外部USB硬盘驱动器会定期往返于我的设施以更新其文件(用于非现场备份)。 HDD,而不是SSD。 我怎么测量它是否过于粗略处理? 我宁愿不要等待轴承开始尖叫。 制造商在频率范围(Hz)内指定(closures)G的冲击容限,推测是在最坏的情况下,平行于旋转轴,在这个位置上,磁头可能接触到磁盘。 不知何故,一个无动力的硬盘本身能记住机械冲击吗? [ 编辑:不太可能。 SMART属性191“机械震动”在没有动力的情况下对检测没有任何说明。 降级的基准性能是否意味着粗暴的处理? (粗暴的处理能导致比灾难性失败更温和的症状吗?) Crazy将高G加速度计粘贴到磁盘机箱,在旅行时连接到Arduino数据logging器?

英特尔SSD的原始读取错误率

我已经配备了一些英特尔S3610的几台服务器,我有点关心“原始读取错误率”值。 这些工具显示所有驱动器都是健康的,并且没有其他错误,如下面为一个驱动器粘贴的完整SMART数据所示。 这些值是否意味着什么? :~# isdct show -smart 01 -intelssd – SMART Attributes BTHXXXXXXXX800NGN – – 01 – Action : Pass Description : Raw Read Error Rate ID : 01 Normalized : 130 Raw : 3163710634 Status : 14 Threshold : 39 Worst : 130 – SMART Attributes BTHXXXXXXXX800NGN – – 01 – Action : Pass […]

服务器给我一个SMART失败预测

我有一个较老的xSeries 306,已经开始给我一个硬盘2上的SMART故障预测:SATA端口0消息,一个关于备份的警告和一条消息, 按F1继续 。 这是我的理解,SMART实际上是硬盘驱动器本身的一部分,但这种情况发生在其他系统可以正常工作的硬盘上。 我已经把一个新的硬盘驱动器,并试图重新安装服务器2003年(仍获得SMART警告)。 安装程序看到硬盘驱动器,我尽可能格式化驱动器。 它只是挂在0%。 我认为这不是真正的计算机感知SMART问题,而是服务器本身的问题。 任何想法,而不是一个糟糕的主板可能会导致这一点? 顺便说一下,这个系统只有1个硬盘。 我从来没有注意到它被称为“硬盘2:SATA端口0”。 这是正常的吗? 谢谢

通过smartd.conf设置阈值

我们目前使用smartd来监控磁盘上的SMART运行状况。 我想确定一下smartd用来报告的“阈值”。 例如: 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always – 9 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline – 9 我希望能够为这两个属性设置一个阈值,只在10以上时才报告。我还没有find通过smartd.conf来设置的方法,而且我也没有想到实际上closures守护进程。 有没有人试过这个,或者知道我可以怎么做,然后把脚本写入cron.hourly呢?