我有戴尔PowerEdge T710 w /集成的PERC H700 RAID控制器。 我正在镜像的RAID中运行两台500G硬盘。 整个机器运行VMWare ESXI 4,并通过Vsphere访问机器。
它是全天候运行,我想知道如何才能真正知道镜像RAID是否失败,我需要交换一个新的驱动器?!
谢谢你对这个新手问题的任何帮助。
来自任何主要供应商的完全支持的硬件上的ESXi将生成VI CLient中可见的RAID控制器警报。 由于HCL上的H700,如果不提供警报,我会感到非常惊讶,旧的PERC6卡肯定会这样做,有时甚至会令人讨厌 。 如果VMware(或者任何其他人)能够提供一个关于什么级别的故障报告,他们内置的硬件健康状况监测实际上可以为每个设备提供的确切的清单,但这不是我所能find的,这将是一件好事。
如果ESXi支持SNMP,这将更加容易,但是不幸的是,您必须使用WBEM \ CIM,这不太容易启用和交互。 如果你能得到它的工作,我在这个相关问题的答案中引用的Nagios \ Python脚本可能会给你一些更好的信息。
对于您可以采取的各种步骤, Dell可以通过ESX和ESXi V4 \ 4.1上的OpenManage Server Administrator代理实现更高级的监控,如果您要完全启用ESXi主机上的远程监控, 。 即使这样,您也仅限于CIM \ WBEM和SNMP陷阱,SNMP查询在ESXi上不起作用。
您可以在ESX主机上安装OpenManage Server Administrator,并使用它来监视系统,并在驱动器出现故障时提醒您。
这里有一个安装指南: http : //support.dell.com/support/edocs/software/smsom/6.2/en/omsa_ig/html/instesxi.htm#wp10982 链接文本 85
在VMWare ESXi上监视硬件RAID的答案中有一个非常类似的问题
对于运行VMware产品的R710,我喜欢使用戴尔软件来提醒我。 您将安装Dell OpenManage,configuration警报,提供DRAC和IP,将消息发送到您的smtp服务器/所需的邮件组/个人。 这样,如果您有任何硬件故障,OpenManage将知道,因为这是它的工作,那么DRAC将发送邮件,因为接近最坏的情况下,服务器closures,但DRAC仍然有权力,可以警报。
1)转到support.dell.com。 selectR710作为您的系统,或input服务标签。 在下拉列表中select您的操作系统。 下载Dell OpenManage系统pipe理员(独立)。 2)通过安装ISO从vCenter进行安装或制作物理磁盘,并在vCenter中连接到DVD驱动器3)执行快速安装。 您可能必须重新启动esx mgt服务和/或dell服务。 4)通过浏览器连接到OpenMange https://您的服务器IP或DNS名称:1311 5)configurationOpenmange(设置警报,设置SMTP服务器)6)在OpenManage中设置DRAC – 给它一个IP并更改默认的/ root密码4)通过网页浏览器连接到DRAC端并检查configuration。
警报现在将从您的DRAC IP脱机。 所有的邮件设置完成后,通过拉动1根电源线重新连接进行testing。 你应该看到有4封邮件脱落(电源冗余降级,电源冗余丢失,然后回来) – 只是一个简单的testing,以确保你通过邮件。
您可以从vSphere API本身获取有关RAID存储的一些信息。 尝试使用vSphere API,但只能从RAID设备中检索有限的信息。