我的OGEconfiguration有问题。 节点的load_avg没有被设置(保持在-NA-)。 由于这个原因,并且由于队列上的np_load_avg阈值,没有任何作业正在运行。
[ce@node1 ce]$ qhost -F -lh=node2 HOSTNAME ARCH NCPU LOAD MEMTOT MEMUSE SWAPTO SWAPUS ------------------------------------------------------------------------------- node2 - - - - - - -
默认/ spool / localhost /消息和qmaster /消息中都不会popup错误消息。 队列调度消息是“复杂属性np_load_avg没有值”。
我看不出有什么迹象表明可能会出错,执行节点上的以下工作:
问题出在我的/ etc / hosts文件中,我有:
127.0.0.1 node2
这不得不成为:
10.0.0.2 node2
最后给我
[ce@node1 ce]$ qhost -F -lh=node2 HOSTNAME ARCH NCPU LOAD MEMTOT MEMUSE SWAPTO SWAPUS ------------------------------------------------------------------------------- node2 linux-x64 8 0.00 31.3G 308.8M 11.9G 0.0
和
[ce@node2 ce]# utilbin/linux-x64/gethostname Hostname: node2 Aliases: Host Address(es): 10.0.0.2