Sun Grid Engine:自动终止空闲交互作业

我们正在考虑在小型计算集群上使用Sun Grid Engine 。 目前,目前的设置是相当粗糙的,只是涉及到人们ssh到一个开放的机器来运行他们的工作。

我们希望允许交互式作业,因为这会缓解从手动启动作业到使用qsub启动它们的过渡。 但是,有人担心,如果我们这样做,人们可能会意外地将其交互式会话闲置,并阻止其他工作在机器上运行。 这个问题不仅仅是理论上的问题,因为我们以前曾经尝试过使用OpenPBS,而且在屏幕会话中开放一个交互式工作并且基本上是在一台机器上驻扎的时候出现了一个问题。

无论如何configurationSGE自动杀死空闲的互动作业? 看起来这是在2007年被要求作为一个增强( 问题#:2447 )。但是,它似乎并没有得到执行的要求。

您可以将SGE设置为具有合理的默认墙壁时间(h_rt),以在预定义的限制之后终止会话。

你有没有试图让用户的shell在闲置超时? 更多信息和例子在http://www.cyberciti.biz/faq/linux-unix-login-bash-shell-force-time-outs/

nayrmil有一些很好的build议。 另一种select是限制哪些机器可以运行交互式作业。 我们基本上把一些节点指定为“交互式”,并在其上放置一个超额订阅节点资源的队列,这样很多用户可以立即login。 用户基本上可以在那里长期居住,但如果他们想获得一些真正的资源,他们需要提交一份合适的工作。