我们的ESX服务器出现问题。 所有其他机器正常运行,但不是这个。 它是我们ESX上唯一运行的Linux服务器(所有其他操作系统都在Windows上运行),也是唯一一个存在这个问题的Linux服务器。
它是3个星期前安装的,运行正常,直到上个星期四。 从这一天起,它开始随机丢弃与特定主机的连接。 例如,我正在使用安装的软件上的Web界面和开放的SSH连接(用于查看日志)。 突然我的浏览器和我的SSH连接正在下降“连接被拒绝”,我无法重新连接,虽然ping工作。 对于我的同事,一切正常。 后来我能够再次连接,而我的同事却没有。 好像只有2-3个人可以同时连接到服务器。
服务器有一个静态IP地址,我们的DNS(基于Microsoft Active Directory的)有一个静态租约。
产品安装期间应用的configuration:
ulimit -n 8800 echo "* soft stack 32768" >> /etc/security/limits.conf echo "* hard stack 32768" >> /etc/security/limits.conf echo "* soft nofile 65536" >> /etc/security/limits.conf echo "* hard nofile 65536" >> /etc/security/limits.conf echo "* soft nproc 16384" >> /etc/security/limits.conf echo "* hard nproc 16384" >> /etc/security/limits.conf
防火墙被closures( service firewalld stop ),这并没有改变任何东西。 我没有看到消息日志文件中的任何东西。
安装的软件:
我是一个具有基础networking和Linux知识的开发人员,但是我在这里想法不多了。 有没有build议我检查的日志? 我怎样才能debugging这个系统?
那么,现有的连接不能被拒绝“连接被拒绝”,这可能是“连接重置”。 在中断期间尝试build立的新连接会发生什么情况 – 是超时还是立即拒绝? 无论如何,这种行为类似于我的一些其他networking设备的IP地址冲突..