我有一个软件RAID1arrays的两个硬盘驱动器的Ubuntu服务器。 这些都是相同的驱动器,我假设他们在一生中看到相同的读/写活动水平(纠正我,如果我错了)。 这是否意味着期望这些驱动器在1-2周之内失效是合理的? 或者我错过了有关RAID1和磁盘故障的信息?
我正在运行一个CentOS 7机器(标准内核: 3.10.0-327.36.3.el7.x86_64 ),并在16x 1TB固态硬盘上安装软件RAID-10(更确切地说,磁盘上有两个RAIDarrays;一个的arrays提供主机的交换分区)。 上周,SSD失败了: 13:18:07 kvm7 kernel: sd 1:0:2:0: attempting task abort! scmd(ffff887e57b916c0) 13:18:07 kvm7 kernel: sd 1:0:2:0: [sdk] CDB: Write(10) 2a 08 02 55 20 08 00 00 01 00 13:18:07 kvm7 kernel: scsi target1:0:2: handle(0x000b), sas_address(0x4433221102000000), phy(2) 13:18:07 kvm7 kernel: scsi target1:0:2: enclosure_logical_id(0x500304801c14a001), slot(2) 13:18:10 kvm7 kernel: sd 1:0:2:0: task abort: […]
我们都知道SSD提供HDD驱动器的许多优点(例如速度),但是如果驱动器出现故障,哪个更安全? 根据我对SSD驱动器数据的理解,存储在芯片上,当芯片死亡时,所有数据都将丢失(如USB闪存驱动器),但是在HDD上,您可以检测预失败并防止数据丢失。 这是真的? 在这方面寻求专家意见。 谢谢。
我最近有一个三星840 Pro 256 GB固态硬盘在我们的服务器上失败。 该驱动器configuration在RAID 1arrays中,重新启动足以使事情恢复在线状态。 在查看英特尔快速存储仪表板时,我现在有以下输出: 我遇到的问题是将故障磁盘从服务器中的4个物理驱动器中分离出来。 我希望驱动器托架上有一个橙色的警告灯,但是它们都是绿色的。 英特尔快速存储不会显示驱动器序列号,事后应该已经标记在驱动器本身。 有没有什么办法可以确定哪些驱动器出现故障而无需拔出服务器或使用某种forms的试验和错误?
这是一个常见问题,但我迄今发现的所有答案都不适合完全自动化,这是我所需要的。 所以在这里再次。 在Linux中: 是否有一种可靠的方法来parsing硬盘的udev设备名称(例如“/ dev / sdg”)到其数据path中,以识别设备连接的物理真实电缆(EG“PCIe-Slot2,SAS通道0,复制器端口3“? 我在热插拔背板上运行了十几个SATA磁盘的服务器。 使用dmraid(Linux)将磁盘组装成软件Raid6。 由于这个问题的范围以外的原因,我想和需要运行软件RAID,而不是通过专用控制器硬件突袭。 软件RAID的缺点之一是当驱动器arrays中的驱动器发生故障时,驱动器托架上的故障指示灯不亮,因为该驱动器无法轮询mdadm以查找驱动器状态。 您必须手动find故障驱动器的位置。 我知道你可以只发出一个dd if=/dev/sdg of=/dev/null ,看看哪个活动指示灯亮了,但是我正在瞄准这个漂亮的解决scheme。 为了解决这个问题,我一起砍了一块PCB,通过i2c与背板对话,打开/closures托架的故障指示灯,我有一个脚本通过RS232与这块主板通信。 当发生故障事件时,mdadm可以运行命令,所以我可以告诉mdadm运行我的脚本,并在驱动器掉出arrays时打开LED。 唯一的问题是: mdadm告诉我“驱动器/ dev / sdg1失败” 。 但是我需要的是“驱动控制器1,通道2,端口3失败” ,所以我可以识别哪个LED打开。 有没有人知道一个可靠的方式来解决设备名称像/ dev / sdg回到path? 我知道hdparm -I /dev/sdX将给我的驱动器的序列号和供应商,所以我可以通过查看标签手动识别磁盘,但重点是自动执行此操作。 可靠地识别所涉及的控制器/端口就足够了,因为在使用背板时布线通常不会改变,并且我知道什么控制器端口服务于什么驱动器托架。 我的第一个想法是做ls -lah /dev/disk/by-path | grep /dev/sdX ls -lah /dev/disk/by-path | grep /dev/sdX作为适当的目标名称,但是这certificate是不可靠的,因为目前安装的磁盘一半都没有出现在该目录中。 只是说“你的第一个控制器将有sda-sdh,你的第二个控制器将有sdi-p”也是不可靠的,因为在启动时有一个竞争状态,有时一个控制器被初始化,有时是另一个。 无论哪一个首先被初始化得到/ dev / sda …另外事情变得复杂在一个热的交换或者如果不是所有海湾被填充。 lshw -short -c […]
我们在几个HP系统(ProLiant DL360 G5)中更换了坏的硬盘,但是它们仍然显示失败。 驱动器是RAID的一部分,我想这可能是他们出现失败的原因。 固件/型号不一样,尽pipe它们都是HP驱动器。 这就是为什么他们会保持失败的状态吗? 他们是新的驱动器,所以我不认为他们已经坏了。
我有一个HP ProLiant Web服务器,带有两个HP 300GB SAS SFF 2.5英寸驱动器(型号: HP 507127-B21 )。 两个驱动器都有稳定的红灯,但pipe理软件中没有任何指示处于故障前状态。 另外这些驱动器之一只在3-4个月前才被更换。 除了即将发生的驱动故障之外,这些指示灯能否指示其他事情? 也许固件更新或一些关于RAID控制器的健康状况的下游警告? 我已经在这里查看了惠普文档 ,但是一个稳定的琥珀色或红色的灯光表示驱动器出现故障。 服务器上没有任何关键的东西,但如果可以的话,我想解决这个问题。 附加信息: 以下是HParraysconfiguration实用程序的屏幕截图。 这是带有照明警示灯的驱动器的图片。 灯光可能是琥珀色的,从我得到的照片中很难说。 6月30日更新 我发现惠普已经针对这一精确驱动器发布了一个已知故障的客户咨询 。 我正在运行由HP发布的诊断软件来确认。 8月5日更新 好的,我必须等待一段时间才能closures机器。 从冷启动完全重启机器后,警告灯持续亮起。 仍然没有任何迹象显示arraysconfiguration实用程序中有任何错误,并且在启动时没有警告或提示。 在几个星期之内,我将退休机器,这样它可以在非关键性的事情上实现其余的生命,直到最终嘎吱嘎吱。
我跑得很快,出现了一些奇怪的错误,虽然磁盘相当新鲜Power_On_Minutes 427h + 41m 我很好奇,这些是以前的硬盘的错误吗? Error 1 occurred at disk power-on lifetime: 13729 hours (572 days + 1 hours) When the command that caused the error occurred, the device was active or idle Error 2 occurred at disk power-on lifetime: 23300 hours (970 days + 20 hours) When the command that caused the error occurred, […]
今天我收到了一封相当不错的电子邮件,build议RAID1arrays中的一个驱动器出现故障。 A Fail event had been detected on md device /dev/md4. It could be related to component device /dev/sdc2. Faithfully yours, etc. PS The /proc/mdstat file currently contains the following: Personalities : [raid1] md4 : active raid1 sdd2[1] sdc2[2](F) 87667136 blocks [2/1] [_U] md3 : active raid1 sdd1[1] sdc1[0] 250304 blocks [2/2] [UU] 奇怪的是,sdc2只是一个分区,另一个分区没有失败。 由于在另一个国家的服务器,我不能实际检查它。 […]
我想采取失败的驱动器,向HP发送诊断报告,以便我可以自动将驱动器运送到正确的位置。 我正在考虑编写C#代码来自动login,在下面发布一个案例,将驱动器诊断作为附件。 这是可能的一些C#魔术,但我宁愿有一个支持的方式。 题 惠普支持是否有自动的方式来打开案例? 如何访问HP服务中心 1. Navigate www.hp.com/go/hpsc 2. Login into your account. (If you dont have one, you can register yourself in the HPSC website). 3. Click Get help from HP 4. Click Submit or manage support cases 5. Select the option ;Submit a case from the left side pane 6. Enter the […]