头节点(硬盘,内存,处理器,冗余)的硬件configuration

我正在devise一个头节点,其主要function是向Torque / Maui调度程序提交作业,第二个function是运行testing作业。 不幸的是,大多数集群的硬件select指南都是在2000年〜2004年编写的,现在大多数都是不相关的。 我已经能够很容易地决定硬件configuration的大部分内容(例如,基于互连的NIC),但我不明白如何select硬盘/内存/处理器。

  1. 硬盘驱动器:由于我使用的是networking存储,因此硬盘的尺寸/types(SSD与主轴)几乎没有关系,因为这些只需要满足典型的启动驱动器的要求?

  2. 内存:假设testing任务不是内存密集型的,那么头节点拥有大量内存是否有任何性能优势? 作业调度似乎并不需要大量的内存。 如果没有,用什么经验法则来决定我需要多less内存?

  3. 处理器:将testing工作排除在外,在处理器上拥有更多内核或更高的时钟频率有什么优势? 我可以想象,这个作业调度不是计算密集型的,几乎不能从更快的处理器或并行性中获益。

  4. 冗余:如何避免头节点成为SPOF? 有2个或更多头节点? 我是否将冗余头节点完全保留为被动(未使用) – 否则,我会想象从死亡节点中恢复过来会非常麻烦。 头节点之间是否可以接受异构(不同的硬件规格)? 头节点上的引导驱动器是否需要RAID镜像?