Ubuntu的盒子经常崩溃

我有一个24小时运行的Ubuntu 11.04盒子。 它最近几天就开始崩溃了。
我检查了kern.log,dmesg …但没有发现任何东西。 是否有特定的地方closures的原因(温度,或其他)logging?

你有监控你的服务器?

其实,我的答案是:如果没有,请为您的服务器添加监控。 你至less应该有:CPU负载,CPU温度,磁盘使用率,磁盘温度,磁盘IO,NICstream量。

只需select一个你可以轻松安装,维护。 任何或这些组合将工作(不完整的列表):mrtg,仙人掌,zenoss,nagios等; 有适当的插件,snmp或rrd脚本。

碰撞发生后查看图表寻找线索。

我有一个运行24/7的unbuntu 11.04盒子,现在有两年时间了

你知道这是不可能的,对吧?

要么不是2年,要么就升级了。

检查升级日志是否有任何问题。