在Beowulf计算节点上启用cgroups

我们使用来自Penguin Computing的Scyld发行版运行Beowulf集群,看起来cgroups是在头节点上configuration的,而不是在计算节点上configuration的。 我试图configurationSlurm使用proctrack/cgroup插件,但它不能在计算节点上工作。

例如,我可以列出头节点上的cgroup,但不能在计算节点上列出:

 $ bpsh -1 systemd-cgls ├─1 /usr/lib/systemd/systemd --switched-root --system --deserialize 21 ├─user.slice ... $ bpsh 1 systemd-cgls Failed to create bus connection: No such file or directory $ 

如果我查看cgroup系统的安装点,它将安装在头节点上,而不是安装在计算节点上。 计算节点在该位置只有一个空目录。

 $ bpsh -1 findmnt /sys/fs/cgroup TARGET SOURCE FSTYPE OPTIONS /sys/fs/cgroup tmpfs tmpfs ro,nosuid,nodev,noexec,mode=755 $ bpsh 1 findmnt /sys/fs/cgroup $ bpsh 1 ls -l /sys/fs/cgroup total 0 $ 

我假设我必须在计算节点上启动一些cgroup服务,但是如何? 我在cgroup上find了RHEL 文档 ,但仅描述了它们,而不是初始设置。

更新

man7.org介绍了如何挂载cgroups控制器,但是这样说:

请注意,在许多系统上,v1控制器都自动安装在/ sys / fs / cgroup下; systemd(1)会自动创build这样的挂载点。

这就解释了为什么我在头节点上看不到cgroup的任何configuration:它们只是自动挂载的。 为什么他们不能自动安装在计算节点上?

它看起来像驱动程序加载在计算节点上,但没有安装:

 $ cat /proc/cgroups #subsys_name hierarchy num_cgroups enabled cpuset 6 1 1 cpu 4 1 1 cpuacct 4 1 1 memory 2 1 1 devices 3 1 1 freezer 10 1 1 net_cls 7 1 1 blkio 5 1 1 perf_event 9 1 1 hugetlb 8 1 1 pids 11 1 1 net_prio 7 1 1 $ bpsh 0 cat /proc/cgroups #subsys_name hierarchy num_cgroups enabled cpuset 0 1 1 cpu 0 1 1 cpuacct 0 1 1 memory 0 1 1 devices 0 1 1 freezer 0 1 1 net_cls 0 1 1 blkio 0 1 1 perf_event 0 1 1 hugetlb 0 1 1 pids 0 1 1 net_prio 0 1 1 

我尝试在/var/log/messagessearch“cgroup”,并且发现头节点正在初始化cgroup子系统,但没有发现计算节点。