在一个中等大小的环境中可接受的以太网错误数量?

我正在为现有的适中规模的数据中心部署实施监控系统。

到目前为止,我只得到了监视方程的主机/应用程序端,但我注意到我认为在各种主机上的以太网错误数量惊人。 对我来说,每个主持人每天3或4个(有的没有)。 当我查看交换机的SNMP计数器时,我再次在计数器上看到很多错误,但是我没有绘制这些错误(还)。

在我以前有更多端口的环境中,除了那些像双工不匹配这样的实际问题的主机,我的错误率几乎为零。

这些接口都没有饱和; 他们通过演出链接推动大约40-50兆字节/秒。

我的直觉是,如果一切正常,应该没有任何错误,但是我担心,如果我为解决这些问题而吵架,我会疏远其他所有相信“它可以正常工作”这是多年来的工作方式“。

任何人都有一些好的故事/研究/统计数据,以便何时对以太网错误报警? 或者说明一小部分错误会影响iSCSI卷?

谢谢!

TCP / IP可以很好地处理错误。 一个单一的错误将被重新发送,一切将通常是hunky-dory。

每天3-4个错误的一致数字是令人震惊的,因为它表明了一个可能的问题(坏的电缆,端口等),但它本身并不值得搔痒。 一个单一的错误可能是由电磁干扰到非常糟糕的亚primefaces事件造成的。 在这两种情况下,对您的networking的影响是微不足道的。

如果它会成为一个政治问题,就把它留下来(但要留意它)。 如果我开始看到错误发生得更频繁,或者至less占总数据包的更高百分比,我只会觉得合适。 0.1%可能是一个不错的门槛,但这一切都是一个装甲脖子,你会突出的问题是。