我有一个网格集群。 (它正在运行SGE,但我认为这没有关系。)所有的机器都可以随时退出并回来,没有任何重大的问题。
但是,我的用户需要运行cron作业的能力。 现在,他们只是随便挑选一台服务器,并在其上放置一个cron作业。 我可以分配一个特定的服务器,无论是在网格或外部,他们运行他们的工作,但这似乎是错误的。
有没有人有一个解决scheme的crontabs集中存储,但运行(可能)其他地方? 还是我只是在推翻这个?
你为什么不让用户在你的提交服务器上设置他们的cron作业,并让它使用qsub或qrsh来真正执行他们需要在集群上运行的任务? 这不就是网格/集群首要的一点吗?