如何使用CentOS 6监控戴尔PERC H710 Raid控制器的硬盘状态?

我有一台运行CentOS 6的戴尔服务器,使用带Raid 5设置的PERC H710 Raid Controller卡,我想监视Raid Controller后面的硬盘故障/工作状态。

那么我应该可以使用bash脚本来监视硬盘状态,并在发生问题时发送警报邮件。

用于CentOS / Red Hat / Linux的LSI MegaRAID SAS命令工具(关于LSI MegaRAID SAS Linux Tools)不支持PERC H710,而smartctl也不支持。

基于戴尔网站, CentOS不支持此服务器( NX3200 PowerVault ),我无法下载任何Linux程序来监视硬盘。

 [root@server ~]# lspci | grep RAID 03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05) [root@server ~]# smartctl -a /dev/sda smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build) Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: DELL Product: PERC H710 Revision: 3.13 User Capacity: 299,439,751,168 bytes [299 GB] Logical block size: 512 bytes Logical Unit id: .... Serial number: .... Device type: disk Local Time is: Tue Apr 15 16:38:30 2014 SGT Device does not support SMART Error Counter logging not supported Device does not support Self Test logging 

任何人都知道如何监控戴尔PERC H710与CentOS 6硬件突袭后的硬盘状态?

SMART 不是磁盘或存储监控中的最后一个字! 这是一个组件,但现代RAID控制器使用它与其他方法来确定驱动器和arrays的健康状况。

我假设这是Dell PowerEdge服务器中的PERC控制器。

戴尔硬件健康监控的常规Linux方法是通过Yum安装适用于Linux的戴尔OMSA代理 – http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup

yum install srvadmin-all都会安装全套的代理。 安装完成后,您可以使用omreport命令获取有关数组的信息 。

例子:

omreport storage vdisk

omreport storage pdisk controller=0

您可以使用smartctl命令和-d参数查看磁盘的SMART状态。 例如,要查看数组中的第一个磁盘:

 # smartctl -a /dev/sda -d sat+megaraid,00 smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build) Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net === START OF INFORMATION SECTION === Device Model: ST91000640NS Serial Number: ........ LU WWN Device Id: . ...... ......... Firmware Version: AA08 User Capacity: 1,000,204,886,016 bytes [1.00 TB] Sector Size: 512 bytes logical/physical Device is: Not in smartctl database [for details use: -P showall] ATA Version is: 8 ATA Standard is: ATA-8-ACS revision 4 Local Time is: Thu Jul 10 11:21:52 2014 WEST SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED Warning: This result is based on an Attribute check. ... ... # 

这是使用smartmontools-5.43-1.el6.x86_64的Scientific Linux 6(另一个基于RHEL6的操作系统)。

接受的答案build议大胆yum install srvadmin-all 。 Blecch。 下面是如何让它稍微减less一点(但是仍然是很重要的,你可以在惠普的平台上精简一些,但是我会离题的)…我的意思是,只安装必要的组件来pipe理你的机器上的存储。

顺便说一句,用户的问题的直接答案在于下面的列表中的项目“在虚拟磁盘0上显示物理磁盘”。

 wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi bash bootstrap.cgi yum install srvadmin-base yum install srvadmin-storageservices 

添加到根的.bashrc:

 export PATH=$PATH:/opt/dell/srvadmin/bin 

请享用:

RAID命令

  • 显示控制器0上的所有物理磁盘

    omreport storage pdisk controller=0

  • 显示控制器0上的所有逻辑磁盘

omreport storage vdisk controller=0

  • 显示虚拟磁盘0上的所有物理磁盘

omreport storage pdisk controller=0 vdisk=0

  • 重新configuration一个虚拟磁盘raid0从raid1( COOL !!!!

omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3

  • 在新磁盘上创build虚拟磁盘:

omconfig storage controller controller=0 action=clearforeignconfig omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2

更多信息

如何在Linux下的戴尔机器上重新configuration我的磁盘arrays?

顺便说一下,因为这不过是一个戴尔品牌的LSI MegaCLI卡,你可能会发现汉索罗的答案更好! 但是,我还没有尝试过。

甜蜜

下面是omreport输出的一个例子,通过grep传递一个美味的数据包:

 # omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not " List of Physical Disks belonging to root Controller PERC H700 Integrated (Embedded) ID : 0:0:0 Status : Ok Name : Physical Disk 0:0:0 State : Online Power Status : Spun Up Bus Protocol : SAS Media : HDD Failure Predicted : No Revision : HT64 T10 PI Capable : No Certified : Yes Encryption Capable : No Capacity : 136.13 GB (146163105792 bytes) Used RAID Disk Space : 136.13 GB (146163105792 bytes) Available RAID Disk Space : 0.00 GB (0 bytes) Hot Spare : No Vendor ID : DELL(tm) Product ID : ST9146852SS Serial No. : 6TB1AFDT Part Number : CN0X162K7262213800JTA01 Negotiated Speed : 6.00 Gbps Capable Speed : 6.00 Gbps Sector Size : 512B Manufacture Day : 05 Manufacture Week : 10 Manufacture Year : 2011 SAS Address : 5000C500395E44C5 ID : 0:0:1 Status : Ok Name : Physical Disk 0:0:1 State : Online Power Status : Spun Up Bus Protocol : SAS Media : HDD Failure Predicted : No Revision : HT64 T10 PI Capable : No Certified : Yes Encryption Capable : No Capacity : 136.13 GB (146163105792 bytes) Used RAID Disk Space : 136.13 GB (146163105792 bytes) Available RAID Disk Space : 0.00 GB (0 bytes) Hot Spare : No Vendor ID : DELL(tm) Product ID : ST9146852SS Serial No. : 6TB1AFEY Part Number : CN0X162K7262213800FPA01 Negotiated Speed : 6.00 Gbps Capable Speed : 6.00 Gbps Sector Size : 512B Manufacture Day : 05 Manufacture Week : 10 Manufacture Year : 2011 SAS Address : 5000C500395E3C1D 

我也努力让它在CentOS中工作,我在这里find了一个工作包http://mirror.ndchost.com/software/lsi/

称为“ MegaCli-8.07.10-1.noarch.rpm

命令参考http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

我希望它有帮助。

 smartctl -d megaraid,00 -a /dev/sda Got MegaRAID inquiry.. FUJITSU MBE2147RC D906 Device: FUJITSU MBE2147RC Version: D906 Serial number: xxxx Device type: disk Transport protocol: SAS Local Time is: 

您好我有一个类似的戴尔PERC / LSI卡,我需要检查RAID状态。 LSI有一个名为sas2ircu的工具,我发现它非常有用,还有一个适用于Windows和Linux的版本。