Mellanox和Infiniband延迟

我通过CX4 3米电缆将Voltaire HCA500Ex-D(MT25408 ConnectX Mellanox)10Gbit卡连接到思科SFS7000d IB交换机的两台主机。

我真的担心延迟比使用相同主机的1Gb以太网连接更高。

  [root @ localhost〜]#ibping -G 0x0008f104039a5589
傍主机a。(无)(盖子3):时间0.238毫秒
傍主机a。(无)(Lid 3):时间0.291毫秒
傍主机a。(无)(盖子3):时间0.320毫秒
傍主机a。(无)(盖子3):时间0.290毫秒
傍主机a。(无)(盖子3):时间0.335毫秒
傍主机a。(无)(盖子3):时间0.281毫秒
大多数人使用相同的IB卡有0.040ms  -  0.050ms的结果。

思科IB交换机和卡正在运行最新的固件。

我已经尝试连接两个主机背对背消除了交换机,但延迟仍然是0.200ms +

有任何想法吗?

下载并安装最新版本的Open Fabrics Enterprise Distribution(OFED)将使您能够访问各种工具,包括ibdiagnet以及其他一些IB性能testing和调整工具。 除了这些工具之外,它还会提供安装和configurationopenibd和OpenSM以及开源子网pipe理器的选项。

根据文件,

Cisco SFS7000d IB交换机

你提到的是运行自己的板载IB子网pipe理器。 这也是有益的

  1. 禁用交换机上的子网pipe理器,并在其中一台服务器上configurationOpenSM

  2. validation交换机上的子网pipe理器的configuration是否适合您的networking

除了采取这些措施之外,还有一些其他testing可以有效地测量无限带宽上的延迟和带宽。 使用消息传递接口(MPI)实现(OpenMPI,或专有版本)乒乓基准testing。 以下是使用OpenMPI进行IBI设置和configurationMPI乒乓testing的一个很好的例子。

高于预期的延迟时间取决于坏的节电行为。

尝试禁用两个主机中的BIOS和卡驱动程序中的任何电源pipe理选项,然后重复使用直接服务器连接进行pingtesting。

它会改变什么吗?