Ubuntu Server 10.04繁重的networkingstream量导致断开连接

我目前正在运行一个无头的Ubuntu 10.04服务器。 安装的是LAMP堆栈,Joomla,Virtualbox,phpvirtualbox,webmin和proFTP ..它parsing了IP地址,所以我可以使用DDClient远程访问它(apache2 web服务器或FTP)。 安装的任何软件包都使用apt-get安装。 Webmin尽pipe在Ubuntu服务器中泄气,但主要用于pipe理Web服务器方面。 当我使用Ubuntu Server 10.10时,也出现了这个问题。

networkingstream量繁忙时,无论是本地还是远程,连接都会丢失。 我正在谈论通过FTP,SCP或Samba传输文件(后者我很less使用)。 没有响应ping或SSH。 我不能FTP到服务器,也不能加载网站。 有些时候,服务器已经打了几天,一切运行良好,因为我没有访问太多,如果有的话(因此没有太多的networkingstream量)。

我经历了一些硬件改动,虽然我不相信这会引起问题:在我做出任何改变之前,这已经发生很久了。 起初我以为这是我的ISP提供的路由器阻塞stream量,因为某种错误configuration(也许假设它是某种DoS攻击)。 我改变了路由器,仍然没有成功。 我已经检查syslog,dmesg和kern.log警告,但没有发现。 我在启动时通过GRUB2菜单运行了memtest,一旦出现了4个错误。 我在各种插槽中再次运行单个RAM,一切都很好。 我已经通过BIOS设置看,一切都很好。 我试图拔掉不必要的硬件(其他内部硬盘驱动器,CD驱动器,软盘,PCI卡等)。

任何帮助或提示,我甚至可以开始解决这个问题将非常感激。 请注意,我只是开始玩服务器作为一种业余爱好,所以我的知识不会是最精致的。 我对命令行感到满意,并且主动知道如何查找我不能做的事情。 不幸的是,我似乎无法find像这样的问题。

另外:如果一个解决scheme找不到一些帮助写一个脚本,将导致服务器自动重启,如果在x分钟后,它不会响应ping任何地方像谷歌。 诚然,这不是最干净的解决scheme,如果我的互联网结束了,但我想不出还有什么要做。

如果服务器完全挂起,那么自动重新启动脚本可能不会有帮助:除非在挂起之前重新启动,否则挂起可能会影响到过程旨在称为重新引导脚本。

通过cron定期重新启动可能会有所帮助,如果在任何挂起之前设置足够的时间触发,但是这将是治疗症状而不是原因。 您可以触发从另一台机器重新启动(如果它检测到服务器停止响应),但可能需要购买一个电源/控制器的硬件,可以从一台机器切换到强制另一台机器重新通电。

我会build议安装某种监视工具,并检查发生挂起之前发生的事情(即在新的连接停止被接受之前)。 我使用collectd(用一个自定义的CGI脚本来绘制logging的结果)进行常规监视,不过还有其他几种常用选项。 使用默认设置(监视CPU使用,内存使用,磁盘I / O,温度读数等等)运行这样的监视工具将帮助您发现明显的事情,例如CPU活动的突然爆发(这可能意味着脚本或脚本DoS情况)或蠕变记忆/交换使用(这可能意味着某处存在内存泄漏,或者在Apache和类似服务的情况下,工人分配configuration不适合机器大小),温度突然boost(这可能意味着stream通问题,通风不良或其他外部环境条件成为问题的一部分)等等。 如果确定了这样的一般性问题,则可以添加更详细的监视以更具体的原因归零。

另外,如果你还没有安装和configurationsmartd。 这可能有助于跟踪问题是否属于正在发展(或已经存在)严重问题的驱动器。

在任何情况下,在挂起之后检查/ var / log中的通常嫌疑人 – 在机器停止响应之前,可能会在/ var / log / messages和/ var / log / syslog(或类似的地方)中find一些线索logging。 如果远程连接启动失败时,机器上没有任何东西停止,那么可能会挂起坏的网卡(但将机器的其余部分保持正常),并保持挂起状态,直到机器重新启动或重新启动。

更具体地说:你的RAMtesting在一两次显示出一些错误,使内存或冷却很可能的罪魁祸首。 你可能会有一些“微不足道”的内存,通常可以正常工作并通过testing,但是偶尔会翻转一些内存并导致问题,或者你可能有一个温度敏感的内存问题(一切正常,直到热点到达某个点)可能是一个更普遍的散热/散热问题。 您的CPU或其他核心芯片也可能遇到热量问题,导致类似的间歇效应。

这可能不是你的原因,但是我已经在使用dhcp的10.04 LTS中看到了这一点。 但是,将接口地址设置为静态时,问题就会消失。

我知道这是一个10.04 LTS的问题,因为我已经看到它出现在至less1台PC和2台带有Intel NIC的服务器上。 我还应该指出,这个问题似乎已经被Ubuntu 10.04 LTS服务器的最新版本解决了。 我相信这是build立3或4。

https://askubuntu.com/questions/102910/ubuntu-server-10-04-lts-xen-intermittent-networking

现在请确保您没有使用DHCP分配地址,即使DHCP服务器设置为始终发出相同的地址。 而是将其静态设置在/ etc / network / interfaces中

类似的问题w / Apache / PHP在RHEL5.x:挂起和控制台/ ssh访问不可能。 日志/ var / log / messages报告“[…] httpd援引了oom-killer […]”

该解决scheme增加了更多的内存,使KDump w / panic_on_oom和创build更合适的Apache / PHP进程限制。 没有问题,因为。 KDump w / panic_on_oom自动重启防止挂起的系统。 然而,真正的解决scheme是限制Apache / PHP。 默认值,尤指 对于PHP而言,开放性太大,并不安全。 有许多保护PHP的在线资源,所以我不会尝试在这里重新创build一个。

我相信这可能是由于服务严重影响您的系统资源。 另一个可能的解决scheme可能是查看可以连接到您的Web服务器和/或多less个主机可以使用路由器。