我有一个24小时运行的Ubuntu 11.04盒子。 它最近几天就开始崩溃了。
我检查了kern.log,dmesg …但没有发现任何东西。 是否有特定的地方closures的原因(温度,或其他)logging?
你有监控你的服务器?
其实,我的答案是:如果没有,请为您的服务器添加监控。 你至less应该有:CPU负载,CPU温度,磁盘使用率,磁盘温度,磁盘IO,NICstream量。
只需select一个你可以轻松安装,维护。 任何或这些组合将工作(不完整的列表):mrtg,仙人掌,zenoss,nagios等; 有适当的插件,snmp或rrd脚本。
碰撞发生后查看图表寻找线索。
我有一个运行24/7的unbuntu 11.04盒子,现在有两年时间了
你知道这是不可能的,对吧?
要么不是2年,要么就升级了。
检查升级日志是否有任何问题。