在HPC集群中运行作业

我对HPC环境相当陌生。 在使用8个内核的节点上运行作业并在使用I内核的8个节点上运行相同的作业,在性能或使用的壁挂时间方面是否有区别。

PS:我正在开发一个项目,其中涉及在集群中运行一个脚本,大约需要2-3天才能完成输出。 因此,这样的疑问,以避免不相关的testing。

可能是。 很难说哪个会更快,因为有很多因素。 如果可能的话,运行一个较小版本的程序,以便可以比较两者。 以下是影响性能的一些因素:

  • 进程间通信(正如Michael在他的评论中所述):同一节点上的内核之间的通信速度比Infiniband快。
  • 资源竞争:在同一节点上运行的进程/线程必须共享I / O(磁盘和networking)和内存等资源。

如果这是一个CPU绑定应用程序,并且有8个可用节点,则可以考虑使用全部64个内核。