有没有办法在运行SLURM的集群上检查资源利用率?

不知道这个问题是否适合在这里或在Unix.SE,但我觉得在这里感觉更合适。 我正在对一个使用SLURM进行调度工作的国家集群进行一些计算量大的研究。

我意识到,我的批处理脚本(创build一堆subprocess)的一部分function比我预期的慢得多,我怀疑有太多的线程被我使用的分析工具调用。

我希望检查是否有太多的上下文切换,但它显示为我需要PID来检查上下文切换的数量 。 通过pstop检查进程没有给出我正在运行的特定工具名称的任何命中,所以我认为由我的脚本运行的实际进程被SLURM“隐藏”在不同的级别。 我认为这是有道理的,因为我通过ssh进行交互的实际计算机和执行计算的节点是不一样的。

但是,有没有办法通过命令行来检查CPU利用率(例如%负载)或上下文切换的数量?