Infiniband端口状态UP但无法打开UMAD端口((null):0)

我的系统有2个infiniband设备,其中一个有两个端口。

$> ibstatus Infiniband device 'mlx4_0' port 1 status: default gid: fe80:0000:0000:0000:0002:c903:000f:0a9f base lid: 0x22 sm lid: 0x1 state: 4: ACTIVE phys state: 5: LinkUp rate: 20 Gb/sec (4X DDR) link_layer: IB Infiniband device 'mlx4_0' port 2 status: default gid: fe80:0000:0000:0000:0002:c903:000f:0aa0 base lid: 0x23 sm lid: 0x1 state: 4: ACTIVE phys state: 5: LinkUp rate: 20 Gb/sec (4X DDR) link_layer: IB Infiniband device 'mlx4_1' port 1 status: default gid: fe80:0000:0000:0000:0002:c903:000f:0a6b base lid: 0x0 sm lid: 0x0 state: 1: DOWN phys state: 2: Polling rate: 10 Gb/sec (4X) link_layer: IB Infiniband device 'mlx4_1' port 2 status: default gid: fe80:0000:0000:0000:0002:c903:000f:0a6c base lid: 0xd sm lid: 0x2 state: 4: ACTIVE phys state: 5: LinkUp rate: 10 Gb/sec (4X) link_layer: IB 

现在,当我通过盖子检查ib端口状态时,

  $> ibportstate -L 10x22 enable ibwarn: [14836] mad_rpc_open_port: can't open UMAD port ((null):0) ibportstate: iberror: failed: Failed to open '(null)' port '0' 

我不确定这个错误信息的原因。 我错过了什么吗?

相应的umad设备文件是否存在(通常是/dev/infiniband/umad0 )?

另外,在我可以访问的系统上,默认情况下设置/dev/infiniband/umad0权限,以使普通用户无法访问它们:

 crw-rw---- 1 root root 231, 0 Feb 1 16:00 /dev/infiniband/umad0 

所以你可以使用sudo来运行你的命令(或者放松/dev/infiniband/umad0的权限)。

这可能只是一个打字错误,但你指定LID为10x22 。 由于LID应该是hex数,所以1是无关的。 它应该只是一个0x22