这个服务器的目的是深度学习algorithm。 我打算做的是用20个GPU(Nvidia GTX 1080 TI)和2个CPU(Intel Xeon Phis)组装一台服务器,然后让许多用户从中获取处理能力。
与此问题相关:如果用户需要8个GPU,那么可以将8个随机免费的GPU分配给他们?
另外,一般来说,这工作? 我仍然不明白在这种情况下操作系统将如何运作。 是否有一些特殊的服务器操作系统(如Ubuntu服务器),我可以用来做到这一点?
谢谢
这不是一台计算机,而是多个独立的计算机(但可能与快速/低延迟的Infinibandnetworking连接)。 您需要一个带有作业调度程序/批处理系统的经典HPC群集环境,例如。 SLURM。