SLES11随机不可达单机

我正在经历一个非常奇怪的问题,现在我迷失了方向。 自从我的公司尝试切换到SUSE以来,我已经设置了几台Suse SLES 11 SP2机器。 而每一台装有SLES 11的机器都有这个特定的问题:

一旦安装,一切工作正常。 但是,如果通过SSH从Debian机器(Squeeze和Wheezy)或Putty(最新版本)连接,则连接偶尔会丢失,机器只能从该机器无法访问。 如果我通过一些随机服务器连接到它,它可以工作,而我甚至不能从我的机器ping那台机器。

更多细节:

  • 在机器上的tcpdump看到我自己的ping尝试,但没有回复正在发送
  • 当这种情况发生时,SSH简单地超时
  • 重新启动networking接口或重新启动可以暂时解决问题
  • 在1分钟和几个小时之间随机发生
  • 所有的机器都在同一个子网上
  • 所有机器都连接到Cisco交换机,在此子网上没有configurationVLAN
  • 检查知识产权盗窃(也许一台笔记本电脑睡觉,随意醒来做东西),没有成功
  • 为了完成混乱,RedHat6机器(完全相同的硬件)的连接永远不会遇到这个问题
  • e1000e模块正在所有这些机器上使用(当然除了腻子窗口),更新到最新的一个或两个固件没有帮助
  • networking电缆也被切换 – 没有成功
  • eeprom_fix_82574_or_82583没有解决这个问题,即使这些问题出现在这些机器上
  • 在这些有问题的机器上安装Debian可以解决这个问题,但是由于公司的原因不需要

所以在这里,我完全无能为力…有没有人有丝毫的想法这里有什么问题?

在机器上的tcpdump看到我自己的ping尝试,但没有回复正在发送

在GNU / Linux中, tcpdump可以看到被本地iptables防火墙阻止的数据包,所以如果你没有看到任何回应被发送,那么可能是因为入站ICMP阻塞,或者源数据库缺lessARP表项。

要诊断这些问题, -e开关tcpdump是有帮助的,因为它打印出链接层地址,并且在分析stream量时也确保捕获ARPstream量。

要排除ARP (简单)的概率,可以添加静态/永久性ARP条目以查看问题是否消失。 如果在添加静态ARP条目后,那么可能有人正在窃取ARP或者一些ARP过滤正在进行。

感谢阿比,我已经find了解决这个问题的方法:

只是。 禁用。 iptables的。

完全地,也就是说,通过在启动时禁用内核模块以及在Yast中预先禁用防火墙。

创build这个文件并重新启动,然后检查lsmod是否仍然加载了iptables:

nano /etc/modprobe.d/netfilter.conf

 alias ip_tables off alias iptable off alias iptable_nat off alias iptable_filter off alias x_tables off alias nf_nat off alias nf_conntrack_ipv4 off alias nf_conntrack off 

之后,路由问题解决了自己与不必要的路由点之间的已经删除,所以它现在只是一个单跳而不是从一开始就两个。

资料来源: http : //backstage.soundcloud.com/2012/08/shoot-yourself-in-the-foot-with-iptables-and-kmod-auto-loading/