我即将安装我们的新群集。 我已经安装了第一个节点并将其用于黄金映像。 作为一个排队软件,我们使用SGE ( Sun Grid Engine )。 在安装了第一个节点之后,我使用qsubtesting了提交,并使用qstat读取了队列统计qstat 。 它按预期工作。 但是,克隆到另一个节点后,SGE不起作用。 我无法启动守护进程。 如果我经过较长时间后最终尝试qstat -f ,我会看到消息:
"error: unable to send message to qmaster using port 535 on host "myHOST": got send timeout*"
我不确定它来自哪里,因为/etc/services和防火墙设置在两台主机上都是一样的。 另一件事是新节点的假脱机目录没有创build(可以理解)。
有人可以告诉我如何安装SGE使用systemimager没有不必要的痛苦。 我不想通过所有计算节点来启动./install_execd