VMWare ESXi 4.1中的随机和select性ARP失明

我们有多个VMWare ESX服务器分布在我们公司之间,执行各种任务。 一台特定的ESXi主机显示出非常奇怪的行为。 当我们的监控系统(Orion)通知我们,它不能再ping箱子时,我们会发现它。

在跳转到所涉及的来宾的本地控制台上时,我们看到它不能ping任何不在其ARP表中的新地址。

起初我们认为这个问题只是和我们的客人有关,因为问题似乎总是发生在另一位客人DevRedis身上 。 但是,今天下午这个问题交换了,并开始发生在ApacheBox而不是DevRedis上。

当我幸运地发现问题的时候,我已经在连接的两边运行了tcpdump(一方面是vmware,另一方面是一个物理networking服务器)并且注意到了以下事件:

  1. 来宾ApacheBox发送一个ARP请求的服务器WindowsBeast的物理地址
  2. WindowsBeast招标ARP是 – 回到networking,指示其物理MAC地址。
  3. ApacheBox从来没有看到ARP是响应。

有问题的ESX主机正在运行VMware ESXi 4.1.0,348481

两个访客( DevRedisApacheBox )都运行CentOS 6.3,但是他们运行两个独立的内核版本( 2.6.32-279.9.1.el6.x86_642.6.32-279.el6.x86_64 ),所以我不是完全确定这是一个CentOS问题。

有没有人有什么想法可能会导致此? 有没有人遇到过它?

这听起来像是你的手上可能会有MAC碰撞。 这两个盒子交换的事实是对我的build议。 vSwitch层中的某些东西可能会错误地转发数据包。