在build造Beowulf集群时陷入困境

我正在非常有限的预算下创build一个beowulf集群,用于模拟stream体stream动问题。 我从来没有创build过一个beowulf集群,我正在寻找build议和陷阱,我会遇到。

硬件失败。 您将不得不继续修复或更换它,所以请确保您有一个简单的方法来处理它。 我使用FAI构build了一个集群来自动部署节点,这样如果出于任何原因(磁盘,CPU,任何)失败,很容易从头开始重build一个新的节点。

如果你以前从来没有这样做过,那么第一次build立一个Rocks集群可以节省你很多时间和挫折,并且教你如果你想在下一次“推出自己”的时候需要知道什么。

http://www.rocksclusters.org/wordpress/