在发生系统故障的情况下,如何最好地处理最终用户通知。 电子邮件?

我被要求研究在系统(如电子邮件)遇到问题时处理最终用户通知的方法。 也许一个例子会使这个更清楚一点。

我们在不同的国家有许多网站。 最近电子邮件在其中一个站点受到影响,但可能是一个完整的networking中断。 通过电话向当地的IT经理提供了信息,但是往来通讯比有些人所希望的要慢。

看起来几乎网站上的每个人都有一部可以接收短信的个人移动电话,也许可以通过发布情况访问一个远程网站。 然而,pipe理和支持一个系统,在这些相对不经常的情况下对人们进行文本处理,在内部执行起来将是非常昂贵的。

其他人在做什么来处理这种情况呢?

我想过的一些事情包括:

  • 电话号码的数据库文本。 看起来代价高昂,对于已经很紧张的IT团队来说,维护起来并不是很容易。 有没有可以让你做这个政策的外部服务?
  • 将语音邮件消息发送到现场的所有电话。
  • 维护一个外部网站。 这在所有情况下都不起作用(networking故障),并且可以在外部发布的信息量有限制。 在某些情况下,站点中断可能是敏感信息。 网站如何被密码保护? 也许OpenId / Facebook连接将工作。
  • 使用像Yammer.com这样的网站是公开的,但只有公司的电子邮件地址的人。 任何人使用这个IT中断通知?

对我来说,看起来没有明确的答案,并且有一些用户子集的解决scheme。 要综合一些解决scheme将需要结合起来。

任何额外的想法或build议? 什么工作或没有为您的组织工作?

我们订阅短信“短代码”系统谷歌短信通知服务。 基本上我们注册手机号码。 授权用户可以发送一个代码到服务,它会发送一个jar头的短信到所有注册号码。 记得短信是不“安全”,所以只有普通中断信息发送。 在每个站点都有一个白板,在发生中断的情况下,pipe理员可以获得更多细节,并将其写入董事会。 这是一个非常低的技术和便宜的系统,我们订阅短信系统的方式支付一个小的服务月费,每次我们发送通知,我们支付一小笔费用,这是基于注册号码的数量被发送到下个月收费。

那么,一个select就是获得一个3G通行卡,并将其连接到一个“监控”服务器(如Nagios或OpenNMS)。 然后在该盒子上运行一个单独的电子邮件服务器,通过空卡发送数据。 你不会使用太多的数据(因为空卡只能用于紧急情况)。 您可以发送电子邮件到手机(号码@运营商的地址),所以即使总的networking中断仍然会通知。 只有停电会杀死系统。 但是,如果您的UPS已连接到监控服务器,则可以检测到电源故障并在发生通知之前发送通知。