ifconfig中一些集群中的某些节点具有较高的帧值

我正在运行一个由22个节点组成的集群。 (同一个1Gbps交换机下有22个节点)。
我注意到集群中的一些节点在ifconfig中具有较高的“帧”值,如下所示。

一些节点(更高的帧):
 eth0链接封装:以太网HWaddr 90:B1:1C:09:D2:F8
           inet addr:192.168.121.20 Bcast:192.168.121.255 Mask:255.255.255.0
           inet6地址:fe80 :: 92b1:1cff:fe09:d2f8​​ / 64作用域:链接
          广播运行多播MTU:1500公制:1
           RX数据包:643150667错误:0丢弃:790超限:0帧:280072
           TX数据包:908361364错误:0丢弃:0超载:0载波:0
          碰撞:0 txqueuelen:1000
           RX字节:377424658828(351.5 GiB)TX字节:864099883266(804.7 GiB)
          中断:170内存:d91a0000-d91b0000

其他节点(下框):
 eth0链路封装:以太网HWaddr 24:B6:FD:F6:DF:34
           inet addr:192.168.121.3 Bcast:192.168.121.255 Mask:255.255.255.0
           inet6地址:fe80 :: 26b6:fdff:fef6:df34 / 64作用域:链接
          广播运行多播MTU:1500公制:1
           RX数据包:1126524649错误:0丢弃:118超出:0帧:43775
           TX数据包:847071691错误:0丢弃:0超载:0载波:0
          碰撞:0 txqueuelen:1000
           RX字节:992080311726(923.9 GiB)TX字节:385366462299(358.9 GiB)
          中断:170内存:d91a0000-d91b0000

它可能有什么问题?

我也运行ethtool和“rxbds_empty”匹配ifconfig中的“frame”,“rx_discards”匹配ifconfig中的“dropped”。
什么是rxbds_empty和rx_discards?
我调查了这些,但几乎没有关于它的信息。
他们来自不良的configuration或设置?

奇怪的是新增6个节点有更高的价值。
另外,我注意到一些程序运行速度比之前添加这6个节点要慢。
程序做的是每个节点并行地向其他随机节点请求大量的短消息。
理想情况下,每个节点都有一定的程序完成时间,但增加的6个节点比其他节点运行速度慢。

任何人都可以给我任何build议吗? 任何帮助将不胜感激。

帧错误指示节点的NIC正在从交换机接收数据时发生某种CRC失败。 你应该在这里检查物理层的拳头:

  1. 使用(显然)电缆testing仪testing电缆。 它至less应该符合Cat5e标准。
  2. 检查交换机上的MTU(可以启用Jumbo帧吗?)
  3. 确认交换机和节点上的端口设置是相同的:端口速度,双工和stream量控制。
  4. 检查交换机上的端口统计信息(例如show interface Gi0/4