我是SLURM的新手。 我正在寻找一个舒适的方式,查看节点/节点列表中有多less内存可用于我的srun分配。
我已经玩了sinfo和scontrol和sstat,但是他们没有一个给我提供我需要的信息。
我有想写一个shell脚本,为了从scontrol中获取所有作业的所有领域,并总结出来。 但是必须有一个更简单的方法。 如果有人有提示或想法,这将是伟大的!
sinfo -N -l输出的第7列将告诉你每个计算节点中安装了多less内存。
$sinfo -N -l Wed Nov 6 16:31:45 2013 NODELIST NODES PARTITION STATE CPUS S:C:T MEMORY TMP_DISK WEIGHT FEATURES REASON node001 1 Def* idle 8 2:4:1 24150 920644 100 Xeon,X55 none
命令scontrol -o show nodes会告诉你在每个节点上已经有多less内存正在使用。 查找AllocMem条目。 (需要Slurm 2.6.0或更新版本)
$ scontrol -o show nodes | awk '{ print $1, $13, $14}' NodeName=node001 RealMemory=24150 AllocMem=0