基本的多播networking性能问题

我一直在使用29west的mtools软件包中的mpong来获得一些思科多种Cisco交换机的基本组播延迟:1Gb 2960G,10Gb 4900M和10Gb Nexus N5548P。 1Gb仅供比较。

我在每台交换机上有〜400次mpong运行结果(发送65536个“ping”类消息给一个接收器,然后发送回来 – 遍历多播),我有以下结果。 数字是以微秒为单位的延迟。

Switch Average StdDev Min Max 2960 (1Gb) 109.68463 0.092816 109.4328 109.9464 4900M (10Gb) 705.52359 1.607976 703.7693 722.1514 NX 5548(10Gb) 58.563774 0.328242 57.77603 59.32207 

4900M的结果是非常令人惊讶的。 我试过单播ping,我发现4900比N5548P有更高的延迟(平均73us vs 64us)。 Iperf(没有试图调整它)显示两个10Gb交换机给我9.4Gbps线路速度。

这两台机器连接到同一个交换机,我们没有做任何组播路由。 操作系统是RHEL 6. 10Gb网卡是HP 10GbE PCI-E G2双端口网卡(我相信它们是重新命名的Mellanox卡)。

4900交换机用于严格访问控制的项目中,所以我在等待批准之后才能访问并检查configuration。 另外两个我有完全的configuration权限。

我已经看了思科文档[1],详细介绍了NX-OS和IOS之间的差异,所以我有一些想法尝试,但这不是一个我有很多专业知识的领域。

有没有人有任何想法,我应该看看,一旦我得到访问交换机?

[1] http://docwiki.cisco.com/wiki/Cisco_NX-OS/IOS_Multicast_Comparison

编辑(格林尼治标准时间09年1月12日)

4900M启用了IGMP侦听。 我看不到交换机或服务器上的计数器丢包或错误。

我看了一下CPU的使用情况,发送ping消息的时候似乎是94%。 75%是“Cat4k Mgmt LoPri”,6%是“IPinput”,3%是“Cat4k Mgmt HiPri”

Edit2(格林威治时间1月12日):

一旦停止消息,CPU使用率将下降到8%。

Edit3(格林尼治标准时间09年1月13日):

问题是第3层相关。 如果我禁用VLAN接口,则延迟将降至72usec。

vlan的configuration是

 vlan 110
 名字192.168.110 / 24-10Ge
结束

 ...略...

接口Vlan110
 说明10GtestingVlan
  ip地址192.168.110.4 255.255.255.0
  ip pim稀疏模式
结束

戴夫,你的第三层预测可能是对的。

试试这两个文件: http : //www.cisco.com/en/US/products/hw/switches/ps663/products_tech_note09186a00804cef15.shtml

你有你的IP组播路由启用? 禁用这个。

启用igmp snooping,在交换机上启用mrouter – 解决scheme3( http://www.cisco.com/en/US/products/hw/switches/ps708/products_tech_note09186a008059a9df.shtml#solu1 )。

Syson(多伦多)

4900是否具有“ip mcast cef”(或者其他的“使用cef进行多播转发”命令)是否启用? 有些平台默认使用进程切换进行组播转发(有些平台,有些IOS版本会使用CEF进行组播,所以……),这会造成极大的负载和延迟。

解决了。 问题是没有configurationPIM RP。