我遇到了一个只发生在几台服务器上的问题。 每隔5-6分钟我就会失去与服务器的连接,并在几分钟后恢复。 在大多数情况下,当同一主机上的其他服务器可达时,该虚拟机无法访问。
我使用tcpdump捕获stream量,以下是pcap的重要部分:
11:49:03.964855 IP6 ::> ff02 :: 1:ffe5:8fb0:HBH ICMP6,多播监听器reportmax resp延迟:0 addr:ff02 :: 1:ffe5:8fb0,长度24 11:49:03.964961 IP6 ::> ff02 :: 1:ffe5:8fb0:HBH ICMP6,多播监听器reportmax resp delay:0 addr:ff02 :: 1:ffe5:8fb0,长度为24 11:49:03.966280 ARP,请求who-has 84 … * tell 84 …,长度28 11:49:03.966632 ARP,回复84 …在00:00:5e:00:01:03(oui未知),长度46 11:49:03.966643 IP 84 …. 50879> google-public-dns-a.google.com.domain:18212+ PTR? 0.bf8.5.eff1.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.2.0.ffip6.arpa。 (90)11:49:08.970373 IP 84 …. 50879> google-public-dns-a.google.com.domain:18212+ PTR? 0.bf8.5.eff1.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.2.0.ffip6.arpa。 (90)11:53:18.356686 IP 84 … *> * .cable.012.net.il:ICMP回显应答,ID 61593,序列号23533,长度64 11:53:18.801857 IP6 ::> ff02 :: 1 :ffe5:8fb0:HBH ICMP6,多播监听器reportmax resp延迟:0 addr:ff02 :: 1:ffe5:8fb0,长度24 11:53:18.801973 IP6 ::> ff02 :: 1:ffe5:8fb0:HBH ICMP6,多播listener reportmax resp delay:0 addr:ff02 :: 1:ffe5:8fb0,长度为24
在最后一个数据包之后,服务器无法连接几分钟。 重要的是要提到,虽然服务器无法从外部访问,但服务器可以连接到远程服务器(通过直接连接到控制台)。 我知道IPV6有问题,但我不明白为什么。
该设置包含Juniper路由器(不能访问路由器) – > L2 Switch – > Proxmox – > VM
Esxi和IPV6一样,
VM - CentOS release 6.3 (Final) - 2.6.32-39-pve Proxmox - pve-manager/3.4-6/102d4547 (running kernel: 2.6.32-39-pve) L2 - Dlink - no special configuration after factory reset. When the VM is not reachable from the outside, pinging inside the LAN causing the VM be reachable from the world again (only for a few minutes)
在proxmox主机本身内部:
brctl showmacs vmbr0 :(当服务器无法从世界上到达)
1 ee:75:67:e5:8f:b0 no 0.59
当服务器可以从世界上访问
2 ee:75:67:e5:8f:b0 no 127.15
我试图更换二层交换机没有帮助。 用新的VM安装一个新的服务器。 相同的结果。
禁用了VM后停止的IPv6,但我不明白为什么。 服务器的设置是完全基本的。
当你做TCPDUMP时,IPv6stream量exception高? 我们遇到了类似的问题,这是由networking上的l217-LM intel驱动程序故障引起的。 简而言之,当具有受影响的驱动程序的机器进入睡眠模式时,它们可以进入其中有两个或更多的机器不断来回传送IPv6消息的状态。 这些信息不足以在交换机上显示为exceptionstream量,但某些设备(包括我们的多function打印机和Sonicwall之一)无法处理这种特定types的IPv6交通,去了100%的CPU,并没有用,直到交通停止。
这是一个更详细的描述它的线程: http : //www.gossamer-threads.com/lists/cisco/nsp/177843
search“HBH ICMP6,多播监听器报告”也带来了类似的问题。
可能的解决scheme之一是过滤或限制交换机上的多播stream量(查找交换机上的风暴控制function),在我的情况下,修复exception的以太网驱动程序。