我需要知道如何获得电子邮件警报如果其中一个RAID 1磁盘无法正常工作/崩溃。 我有CentOS 6.4 64位,软件突袭。
我在做这个教程时犯了一些错误,因为这是个底注
注意:如果DEVICE分区部分不存在于/etc/mdadm.conf文件中,则发现mdadm不会发送电子邮件。 如果这些部分不存在,则可以使用以下命令创build新的/etc/mdadm.conf文件:mdadm -detail -scan> /etc/mdadm.conf“
我执行了这一行,我的mdadm.conf文件是空的whith从ssh的响应: "mdadm: An option must be given to set the mode before a second device (–scan) is listed"
我也undestand我必须启动它使用此ssh行: mdadm –monitor –scan –daemonize但我得到这个响应" mdadm: An option must be given to set the mode before a second device (–scan) is listed "
这是'猫/ proc / mdstat':
Personalities : [raid1] md0 : active raid1 sdb1[1] sda2[0] 117153664 blocks super 1.1 [2/2] [UU] bitmap: 1/1 pages [4KB], 65536KB chunk unused devices: <none>
和
mdadm -D /dev/md0 /dev/md0: Version : 1.1 Creation Time : Sat Aug 17 09:19:15 2013 Raid Level : raid1 Array Size : 117153664 (111.73 GiB 119.97 GB) Used Dev Size : 117153664 (111.73 GiB 119.97 GB) Raid Devices : 2 Total Devices : 2 Persistence : Superblock is persistent Intent Bitmap : Internal Update Time : Mon Sep 16 18:55:19 2013 State : active Active Devices : 2 Working Devices : 2 Failed Devices : 0 Spare Devices : 0 Name : trader:0 UUID : 0944131a:0513ca86:cb8ad6c5:3baca49f Events : 1751 Number Major Minor RaidDevice State 0 8 2 0 active sync /dev/sda2 1 8 17 1 active sync /dev/sdb1
使用mdadm生成mdadm.conf文件1分钟前–examine –scan> /etc/mdadm.conf:
MAILADDR [email protected] ARRAY /dev/md/0 metadata=1.1 UUID=0944131a:0513ca86:cb8ad6c5:3baca49f name=trader:0
如果一个硬盘在我的情况下失败,这是否足以获得电子邮件通知?
Blazer,它看起来像在改善你的问题(顺便说一句,现在是一个很好的)的过程中,你find了自己的答案。 干得好,你! 但是还有一点可以说是有用的。
据我所知,该mdadm.conf将足以让您获得自动通知。 当然,我的看起来与此并无太大的不同,我从最近的一次故障testing中知道我会收到通知。 (我对/dev/md/0的第二个斜线有点好奇,但如果这就是你的系统写的,那很可能是正确的。)
但是在专业的系统pipe理员中,除非你testing了一些东西,否则你不能真正知道它的工作原理。
至less,您需要检查是否可以将该系统的邮件作为root用户发送到指定的gmail.com地址,并接收该邮件。
如果我是你,我至less会进行软故障testing。 你可以用mdadm /dev/md0 -f /dev/sdb1来做到这一点。 这将使第二个分区失败,并且应该生成一个正式的通知给你(检查你的系统的邮件日志,看看它是否消失了)。 检查cat /proc/mdstat的输出,以便知道半坏数组的样子。
您可以稍后使用mdadm /dev/md0 -a /dev/sdb1同步arrays,并检查它是否与另一个cat /proc/mdstat同步。
如果你想整个猪,安排一些停机时间,尝试拉动其中一个驱动器,并检查系统仍然可以启动。 在所讨论的元设备是引导分区的情况下,人们有时会忘记在两个驱动器上都有一个GRUB引导块,所以当第二个失败时,他们的系统就无法启动。 稍后replace并重新同步驱动器。
无论您决定做什么testing,都要logging下来,以便在出现真正的故障时,您知道该期待什么,并且可以最大限度地减less飞行员错误甩掉第二个驱动器的机会。