我有一台运行CentOS 6
的戴尔服务器,使用带Raid 5设置的PERC H710
Raid Controller卡,我想监视Raid Controller后面的硬盘故障/工作状态。
那么我应该可以使用bash脚本来监视硬盘状态,并在发生问题时发送警报邮件。
用于CentOS / Red Hat / Linux的LSI MegaRAID SAS
命令工具(关于LSI MegaRAID SAS Linux Tools)不支持PERC H710,而smartctl
也不支持。
基于戴尔网站, CentOS
不支持此服务器( NX3200 PowerVault
),我无法下载任何Linux程序来监视硬盘。
[root@server ~]# lspci | grep RAID 03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05) [root@server ~]# smartctl -a /dev/sda smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build) Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net Vendor: DELL Product: PERC H710 Revision: 3.13 User Capacity: 299,439,751,168 bytes [299 GB] Logical block size: 512 bytes Logical Unit id: .... Serial number: .... Device type: disk Local Time is: Tue Apr 15 16:38:30 2014 SGT Device does not support SMART Error Counter logging not supported Device does not support Self Test logging
任何人都知道如何监控戴尔PERC H710与CentOS 6硬件突袭后的硬盘状态?
SMART 不是磁盘或存储监控中的最后一个字! 这是一个组件,但现代RAID控制器使用它与其他方法来确定驱动器和arrays的健康状况。
我假设这是Dell PowerEdge服务器中的PERC控制器。
戴尔硬件健康监控的常规Linux方法是通过Yum安装适用于Linux的戴尔OMSA代理 – http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup
yum install srvadmin-all
都会安装全套的代理。 安装完成后,您可以使用omreport
命令获取有关数组的信息 。
例子:
omreport storage vdisk
omreport storage pdisk controller=0
您可以使用smartctl命令和-d
参数查看磁盘的SMART状态。 例如,要查看数组中的第一个磁盘:
# smartctl -a /dev/sda -d sat+megaraid,00 smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build) Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net === START OF INFORMATION SECTION === Device Model: ST91000640NS Serial Number: ........ LU WWN Device Id: . ...... ......... Firmware Version: AA08 User Capacity: 1,000,204,886,016 bytes [1.00 TB] Sector Size: 512 bytes logical/physical Device is: Not in smartctl database [for details use: -P showall] ATA Version is: 8 ATA Standard is: ATA-8-ACS revision 4 Local Time is: Thu Jul 10 11:21:52 2014 WEST SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED Warning: This result is based on an Attribute check. ... ... #
这是使用smartmontools-5.43-1.el6.x86_64的Scientific Linux 6(另一个基于RHEL6的操作系统)。
接受的答案build议大胆yum install srvadmin-all
。 Blecch。 下面是如何让它稍微减less一点(但是仍然是很重要的,你可以在惠普的平台上精简一些,但是我会离题的)…我的意思是,只安装必要的组件来pipe理你的机器上的存储。
顺便说一句,用户的问题的直接答案在于下面的列表中的项目“在虚拟磁盘0上显示物理磁盘”。
wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi bash bootstrap.cgi yum install srvadmin-base yum install srvadmin-storageservices
添加到根的.bashrc:
export PATH=$PATH:/opt/dell/srvadmin/bin
请享用:
显示控制器0上的所有物理磁盘
omreport storage pdisk controller=0
显示控制器0上的所有逻辑磁盘
omreport storage vdisk controller=0
omreport storage pdisk controller=0 vdisk=0
omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
omconfig storage controller controller=0 action=clearforeignconfig
omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
如何在Linux下的戴尔机器上重新configuration我的磁盘arrays?
顺便说一下,因为这不过是一个戴尔品牌的LSI MegaCLI卡,你可能会发现汉索罗的答案更好! 但是,我还没有尝试过。
下面是omreport输出的一个例子,通过grep传递一个美味的数据包:
# omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not " List of Physical Disks belonging to root Controller PERC H700 Integrated (Embedded) ID : 0:0:0 Status : Ok Name : Physical Disk 0:0:0 State : Online Power Status : Spun Up Bus Protocol : SAS Media : HDD Failure Predicted : No Revision : HT64 T10 PI Capable : No Certified : Yes Encryption Capable : No Capacity : 136.13 GB (146163105792 bytes) Used RAID Disk Space : 136.13 GB (146163105792 bytes) Available RAID Disk Space : 0.00 GB (0 bytes) Hot Spare : No Vendor ID : DELL(tm) Product ID : ST9146852SS Serial No. : 6TB1AFDT Part Number : CN0X162K7262213800JTA01 Negotiated Speed : 6.00 Gbps Capable Speed : 6.00 Gbps Sector Size : 512B Manufacture Day : 05 Manufacture Week : 10 Manufacture Year : 2011 SAS Address : 5000C500395E44C5 ID : 0:0:1 Status : Ok Name : Physical Disk 0:0:1 State : Online Power Status : Spun Up Bus Protocol : SAS Media : HDD Failure Predicted : No Revision : HT64 T10 PI Capable : No Certified : Yes Encryption Capable : No Capacity : 136.13 GB (146163105792 bytes) Used RAID Disk Space : 136.13 GB (146163105792 bytes) Available RAID Disk Space : 0.00 GB (0 bytes) Hot Spare : No Vendor ID : DELL(tm) Product ID : ST9146852SS Serial No. : 6TB1AFEY Part Number : CN0X162K7262213800FPA01 Negotiated Speed : 6.00 Gbps Capable Speed : 6.00 Gbps Sector Size : 512B Manufacture Day : 05 Manufacture Week : 10 Manufacture Year : 2011 SAS Address : 5000C500395E3C1D
我也努力让它在CentOS中工作,我在这里find了一个工作包http://mirror.ndchost.com/software/lsi/
称为“ MegaCli-8.07.10-1.noarch.rpm ”
命令参考http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS
我希望它有帮助。
smartctl -d megaraid,00 -a /dev/sda Got MegaRAID inquiry.. FUJITSU MBE2147RC D906 Device: FUJITSU MBE2147RC Version: D906 Serial number: xxxx Device type: disk Transport protocol: SAS Local Time is:
您好我有一个类似的戴尔PERC / LSI卡,我需要检查RAID状态。 LSI有一个名为sas2ircu的工具,我发现它非常有用,还有一个适用于Windows和Linux的版本。