我如何告诉SGE停止将工作分配给计算节点?

我想将一个节点(或一组节点)标记为“离线”,因为我希望Sun Grid Engine停止向其分配新的工作。 这将是节点本身的某种维护工作。 节点应该完成他们分配的任何工作,然后进入某种空闲(“离线”)状态。 我一直在通过qconf文档寻找,但在任何howto中找不到这个用例。

    search导致我到qmod实用程序。 我做了一个简单的testing

    qmod -d QUEUENAME.q@MACHINENAME

    这似乎工作,虽然我没有真正尝试与作业运行。 qstat输出被改变,表明节点被禁用 – 出现“d”标志。

    qmod -e QUEUENAME.q@MACHINENAME

    将再次启用机器。

    在我们的集群上,机器被命名为worker – ## – ##,其中两个数字是机架号和等级号。 我们只运行一个名为“all.q”的主队列。 并且我们集群中的机器在qstat输出中以“.local”后缀列出。 所以上面的命令结束了

    qmod -d [email protected]

    把机器放在机架9上,等级9不在排队轮转中。