服务器似乎,但不接受任何连接

我有一个基于Debian的服务器的问题,不幸的是在一个偏远的地方。 两天前,它突然下降,完全无法到达。 有人重新启动后,它工作了大约一天,然后似乎再次下降。

然而,这一次是不同的:

– 服务器响应ping

它是可扫描的,所有相关的端口是开放的但是:

– 开炮弹被立即封锁,没有警告显示

– 无法打开任何连接 – TCP / IP握手似乎有一些问题:

SSH握手

由于这是一个小型社区的私人服务器,我们没有资源来支付技术人员为我们解决问题,所以任何提示如何解决在下次重新启动后的问题将高度赞赏…

这听起来像机器上的一些进程失控,并消耗了这么多的资源,系统的其他部分无法正常工作。 (RAM,CPU,磁盘IO)。 (或者像其他人指出的那样,这可能是防火墙问题,或者是networking之间的问题。)

但现在,你不知道发生了什么。 你需要这个。

你应该:

  • 用syslog设置远程日志logging
  • build立某种远程监控系统

而且,由于问题似乎正在迅速发生,目前您也可以采取特别的方法:通过ssh远程运行top ,并保持打开状态。 观看系统下一次死机时会发生什么。 但是最终,无论如何你都会从远程login中受益,所以不妨设置一下。

如果您具有串行控制台或KVM等服务器的带外访问权限, 您应该从那里login并诊断服务器。

对我来说,这听起来像是整个系统被挂起了 (但是ping被内核低级处理,这就是为什么它仍然有效),或者你有一个阻止你的防火墙

这看起来像是防火墙的问题。 1. client-> server syn 2. server-> client syn,ack 3. client-> ack

从屏幕截图看来,您的步骤3中的ACK没有被服务器确认。 我认为你的防火墙不允许相关的连接。 你需要在你的iptables中使用类似的规则。

-Ainput-m状态 – 状态RELATED,ESTABLISHED -j接受

mattdm,它真的被塞满了内存,用你的提示,我能够快速诊断错误的脚本 – 一个runsv脚本结合更新,但不兼容的软件包导致成千上万的任务产卵…

不过,我仍然惊讶于这样的效果: – /