我正在尝试使用virtual_free来限制运行群集中每个网格节点的大内存作业的数量。 这似乎按预期工作。
在我修改代码以提交内存实例的作业后,qstat -f -q $ queueName不再显示等待插槽的作业列表。
作业提交了一个特定的队列(-q $ queueName)。
我猜这是由于SGE队列select的魔力而发生的。 有办法让我的工作像以前一样出现吗?
谢谢!
UPDATE
我在用着:
qstat -f -u * -q $ queueName
查看队列。 如果我放弃队列参数,我可以看到工作。 如果我检查一个特定的工作,我可以看到它具有正确的hard_queue_list值集。
我也使用Sun Grid Engine 6.1u4
这些工作正在请求一个队列。 他们实际上并不在队列中,直到他们开始在具有该队列实例的主机上运行。 只有在实际开始在请求的队列中运行时才会在特定于队列的输出中看到它们。 如果考虑到您可以在您的队列请求中使用通配符,这是非常有意义的。
如果他们没有在qstat显示,那么他们不会被提交或已经崩溃,队列select的SGE魔术师在提交之后会踢。 还要检查qstat是否提交了那个提交这个工作的用户的报告!
如果你的工作没有得到满足的约束,那么SGE将直接排队直到他们可用。