为什么我的VPS崩溃(我怎么能find自己)?

编辑 :虽然这似乎是由于在Linode弗里蒙特工厂停电,我仍然有这个问题在过去。 任何帮助,将不胜感激。


我想让你教我钓鱼。

是的,我问“为什么我的VPS崩溃? 我敢肯定,如果我给你的根访问我的服务器,你可以在2分钟内find。 我敢肯定,你可以告诉我发布我的错误日志,我会毫不犹豫地追捕他们。 但那不是我想要的。

我想让你教我钓鱼。

我遇到了一个没有根本原因的问题。 看我的Linode图表,看看我的意思。 networkingstream量和磁盘IO最低时发生崩溃。

替代文字

替代文字

发生这种情况时,我应该看哪些最常见,最常见,最基本的地方是什么,我应该寻找什么?

发生这种情况时我怎么能得到警报(所以在服务器停机的时候我不会错过8个小时)?

如果你的整个服务器由于非服务器相关事件而崩溃,我会去找一个更好的提供者。 停电导致机器掉电的事实表明他们没有任何备份提供商 – 这是令人不安的,特别是因为看起来他们没有提醒你,直到事后。 我很惊讶,因为Linode有相当可靠的声誉。

发生这种情况时,我应该看哪些最常见,最常见,最基本的地方是什么,我应该寻找什么?

你在说什么? /var/log/*或者类似的地方,当你不知道发生了什么事情的时候,可以开始一般性的debugging。 不幸的是,对于未知的服务器崩溃没有真正的满足感。 您可能想要调查在您的许多服务中启用更详细的日志logging,尽pipe需要事先警告 – 这可能会导致您的日志文件膨胀!

 How can I be alerted when this happens (so I don't miss it for 8 hours while the server's down)? 

为此,我已经find了简单的外部服务的最简单的解决scheme。 对于我公司面向未来的网站,我们使用Pingdom等公用程序以及Nagios和Ganglia等内部托pipe工具。 在所有方面进行攻击是最好的select – 有多个来源来检查您的正常运行时间,以及各种地理区域,是监视的标准做法。

请记住,保持自己的版本,拥有(a)在您的networking和控制之外,(b)在全国和/或全世界有多个服务器的东西会让您获得更好的回报。 另外,大部分这些服务都不贵。

我希望这有助于,或者至less让你走上正轨!