我正在研究一个在大约4台不同机器上分布有大约50个进程的系统。 该架构允许任何进程在任何机器上运行,但只允许每个进程在一台机器上运行。 在同一台机器上运行相同的进程或在不同的机器上运行两次相同的进程会造成很大的问
是否有任何现成的软件可以监控机器上的进程,并在死机后重新启动? 如果一台机器死了,然后重新启动一个可用的机器上的进程? 并确保我们从来没有在整个系统上运行同一个进程超过一次?
产品推荐是无关紧要的,但是您所期望的术语是集群pipe理器和高可用性集群 。