一个名为G09的软件使用Linda并行工作。 它在其他节点上产生并行的孩子
/usr/bin/ssh -x compute-0-127.local -n /usr/local/g09l/g09/linda-exe/l1002.exel ...other_opts...
但是,当主节点杀死该进程时,其他节点上相应的subprocesscompute-0-127不会死机,而是继续在后台运行。 现在,我手动去每个有这些孤儿琳达进程的节点,杀死他们。 有什么办法可以杀死这样的subprocess?
在杀死进程之前查看PSTREE的pastebin 1,并在杀死父进程之后查看PSTREE的pastebin 2
pastebin1 – http://pastebin.com/yNXFR28V
pastebin2 – http:// pastebin.com/ApwXrueh
– 没有足够的声望点超链接第二个pastebin,对不起!
最好的select是尝试自己解决问题,并检查为什么孩子的成功没有终止,当他们的父母死亡。
您可以使用此命令在另一台计算机上远程执行命令:
ssh user@remote_machine command
当然,您需要用适当的值replace值: user, remote_machine, and command 。
例如,你可以这样做:
ssh root@remote_machine "killall compute-0-127"