/ var / log / messages中有许多pbs_server错误

在超级计算机的pipe理节点上,我们收到许多错误,例如:

pbs_server: LOG_ERROR::is_request, bad attempt to connect from 10.10.0.254:1023 (address not trusted - check entry in server_priv/nodes) 

在他们之后,几乎每一分钟都是这样的:

 last message repeated 16 times 

重复次数随时间变化。

提到的地址10.10.0.254是pipe理节点的地址之一。 根据“netstat -pa | grep 1023”的端口1023与pbs_mom相关。

事实certificate,pipe理节点每分钟多次试图连接自己,不能这样做。 来自错误文字的build议并没有多大帮助,据我所知,pipe理节点不应该在“节点”文件中。

有人可以build议如何解决这个问题吗?

您的pipe理节点未定义为pbs中的节点。 打开qmgr并运行“create node [hostname without brackets]”。 其他选项是杀死pbs_mom,因为你可能不想在你的头节点上运行计算任务。

我遇到了这个问题,原因是我在计算节点上有多个networking接口(GE,IB),它们都可以到达pipe理节点。

受影响的计算节点中的pipe理节点在单独的子网上定义,因为它应该与不同的NIC配合使用。