每天N次,我们无限期的分钟,有时几小时损失10%

我们正在pipe理像350台服务器,在几个不同的机柜。 有时一段时间,我们失去了10%的乒乓和会议下降与整个机舱。 服务器没有问题是明显的,因为问题始于同时在机柜内的所有服务器同时又在同一时间结束。 (我们正在用一台专用服务器监控那些机柜中的服务器)

除此之外,我们读取80兆比特的stream量,我们认为这不是自然的。 但有趣的是,在午夜之后,当交通应该在20兆位左右时,我们读这个问题发生的时候是80兆位,而在中午我们再读80兆位,当这个问题发生的时候,正常的交通应该在60兆位左右。

当我们有ping问题的时候,80Mbit的读取是那些次数

华盛顿说,他们的路由器,交换机等没有问题,他们说,服务器有问题,但当我们检查服务器,负载接近0或0.5。

所以我们坚持这一点,他们不接受甚至评论这个问题。 我们真的至less需要一个评论,我们相信这是这个问题的真正的地方。 希望你甚至对此发表评论。

更新(7月15日); 现在DC告诉我(我不知道这是多么愚蠢的解释)电缆可能连接到100 MBit端口。 我不知道是否有任何100兆比特的端口留在任何DC,但这是他们的解释。 这是新的图表。

最新图形,问题发生了2个小时

非常感谢你

连接到您的机架式交换机的其中一台设备有可能会出现间歇性变得嘈杂的网卡(并使网段泛滥)。 另外,尽pipe数据中心运营商说了什么,交换机可能会出现问题,但也可能是电缆不好。

如果可能,在发生高数据包丢失时,检查交换机上的指示灯。 大多数交换机都会指出由于网卡发送错误导致的stream量exception(尽pipe这样做的方式差异很大,通常指示连接的指示灯会闪烁,但在任何情况下都是奇怪的) 。

还可能有其他东西泛滥大量的交通; 考虑运行tcpdump或其他东西,看看是否有可能的DoS正在进行。 在networking拥塞期间丢包是正常的行为。