我正在运行一个由22个节点组成的集群。 (同一个1Gbps交换机下有22个节点)。
我注意到集群中的一些节点在ifconfig中具有较高的“帧”值,如下所示。
一些节点(更高的帧):
eth0链接封装:以太网HWaddr 90:B1:1C:09:D2:F8
inet addr:192.168.121.20 Bcast:192.168.121.255 Mask:255.255.255.0
inet6地址:fe80 :: 92b1:1cff:fe09:d2f8 / 64作用域:链接
广播运行多播MTU:1500公制:1
RX数据包:643150667错误:0丢弃:790超限:0帧:280072
TX数据包:908361364错误:0丢弃:0超载:0载波:0
碰撞:0 txqueuelen:1000
RX字节:377424658828(351.5 GiB)TX字节:864099883266(804.7 GiB)
中断:170内存:d91a0000-d91b0000
其他节点(下框):
eth0链路封装:以太网HWaddr 24:B6:FD:F6:DF:34
inet addr:192.168.121.3 Bcast:192.168.121.255 Mask:255.255.255.0
inet6地址:fe80 :: 26b6:fdff:fef6:df34 / 64作用域:链接
广播运行多播MTU:1500公制:1
RX数据包:1126524649错误:0丢弃:118超出:0帧:43775
TX数据包:847071691错误:0丢弃:0超载:0载波:0
碰撞:0 txqueuelen:1000
RX字节:992080311726(923.9 GiB)TX字节:385366462299(358.9 GiB)
中断:170内存:d91a0000-d91b0000
它可能有什么问题?
我也运行ethtool和“rxbds_empty”匹配ifconfig中的“frame”,“rx_discards”匹配ifconfig中的“dropped”。
什么是rxbds_empty和rx_discards?
我调查了这些,但几乎没有关于它的信息。
他们来自不良的configuration或设置?
奇怪的是新增6个节点有更高的价值。
另外,我注意到一些程序运行速度比之前添加这6个节点要慢。
程序做的是每个节点并行地向其他随机节点请求大量的短消息。
理想情况下,每个节点都有一定的程序完成时间,但增加的6个节点比其他节点运行速度慢。
任何人都可以给我任何build议吗? 任何帮助将不胜感激。
帧错误指示节点的NIC正在从交换机接收数据时发生某种CRC失败。 你应该在这里检查物理层的拳头:
show interface Gi0/4 )