Rackspace Linux服务器崩溃

我最近从一个裸机服务器转移到了The Cloud,供个人使用,我不能高兴。 除了一件事: 我的服务器每周大约崩溃一次

Rackspace非常棒,非常有帮助,我希望和他们保持联系并向他人推荐他们。 但有了这个问题,我被告知,服务器只是内存不足,我需要看看它。 虽然我很好,这看起来像我的问题,我从来没有听说过Linux内存崩溃的机器。 根据我的经验,最糟糕的情况是,运行速度确实很慢,否则内核会启动进程。

一些细节:

  • 运行Gentoo Linux(最新)
  • 512MB RAM,1G交换
  • 已安装和运行的服务:
    • 2 Apache 2 procs(1最小,用于静态/caching资源和代理服务; 2nd有cgi,mod_perl和mod_jk)
    • 2个Tomcat实例(1个有我做的两个应用程序,另一个只是Nexus)
    • Mysql的
  • 发生崩溃时:
    • 服务器可以ping通
    • SSH连接无限期挂起
    • 控制台将允许用户名,但密码提示永远不会出现。 60秒后超时,我提出了另一个login提示。 重复。
    • 服务(http,tomcat,mysql)不能联系; 连接将挂起而不报告404,未find服务器等。
    • 软启动将无法工作,硬启动需要经常执行多次(即使在重启尝试之间等待30分钟)

这些年来,我在服务器上运行了相同的设置,但只有256MB内存。 唯一的区别是我在虚拟机上。

我的问题可以采取以下两种forms之一: 是否有人与Rackspace云或其他云主机有类似的问题? (如果是的话,解决scheme是什么?)或者; 追查我的问题有什么好方法? 我设置了一个每分钟输出uptimefree到文件的cron,以便在下次崩溃后检查它,但这看起来很诡异。

完全披露:我是一名贸易软件开发人员,这是我的大部分经验,但我有大约15年使用Linux的桌面和服务器的个人和专业使用经验。

跟踪内存使用情况的另一个好方法是在你的Linux机器上安装sar 。 如果您使用的是Debian,可以将其列为sysstat 。 使用sar -r会给你一个你的内存和networking统计数据的图片。