早上好,
我目前正在寻找一种解决scheme,使我们的组织能够跟踪电子邮件系统的故障(然后通过短信向ITpipe理员发送通知,以便全天候支持)。
我们的最终目标是确定电子邮件(作为完整的服务)何时无法正常工作。 我们的Exchange(2007)服务器可能会失败,如防火墙或垃圾邮件filter发生故障,或者作为另一个“未知”故障点。 解决scheme的关键部分将是IT人员的可靠通知。
我们认识到有一个完全失败的certificate解决scheme可能是困难的,但有没有人有任何build议来引导我们在正确的方向?
谢谢
Igbuild议Nagios可能是解决scheme的一部分 。
开箱即用,可以做很多事情,比如测量CPU,开放端口,系统响应ping。 但重要的是,它是一个调度和报告工具 – 它微不足道的添加新的程序,实际上衡量系统度量。 有很多其他产品可以做这样的事情,但Nagios是更好的免费产品之一(比许多商业产品更好)。 如果你看看商业产品,你会花费数周时间浏览所有的市场营销和function,然后才能发现是否有可能整合自己的指标,更不用说如何去做。 当然,BMC Patrol(新版本)和Oracle的网格控制都可以支持这一点 – 但需要更多的努力。
如果你想testing端到端的function,那么你所需要做的就是设置一个预定的作业,通过系统发送一个电子邮件(在Nagios或常规的调度程序),每5分钟,然后设置在Nagios中定期检查系统中最新的电子邮件 – 如果没有新电子邮件(或最近的电子邮件超过6分钟),则脚本应返回错误状态。
这种脚本在Unix系统上build立起来是微不足道的,但是在MSWindows盒子上可能会更加困难(而且更加昂贵) – 除非你对Unix非常厌恶,否则我build议在Linux上启动Linux或者BSD备用PC运行Nagios和探针 – 但是Nagios可用于MS Windows。
听起来你的脚本正在做所有的努力? 事实上,Nagios可以pipe理升级,可以configuration为根据一天中的时间向不同的人发送警报,在发生警报时触发自动操作(例如,重新引导服务器),并提供大量有关服务为什么可能的信息失败(例如,电子邮件服务器上的磁盘已满)以及其他许多东西…呃利用现有的技能集成问题解决策略?
C。
Nagios或类似的工具
我会第二次symcbean的build议。
设置一个定期发送电子邮件到某个testing邮箱的工作(最好在你的组织之外,也许是某个地方的免费邮箱账户),然后让Nagios检查它。
你可以检查邮件是否在你身边,甚至是否到达(例如,通过POP3邮件)。 后者显然是一个更全面的testing,但如果freemailer出现故障,则可能会失败,因此您可能需要使用两个或三个freemail服务。
如果testing失败,Nagios可以以各种方式提醒您。 您可以通过购买连接到Nagios服务器的硬件设备发送短信,并通过GSM直接发送或通过networking服务。 后者可能更容易,更便宜,但如果你的整个networking连接断开,将会失败。
只要记得不要让Nagios邮寄出警报;-)。