为什么我的纱线工作缓慢/卡住？

我有一个hadoop纱线集群，其工作运行非常缓慢，其中一些卡住了几个小时（以前同样的工作很快，没有什么据我们所知已经改变了configuration）。

我注意到的一件事是，许多集群资源没有被利用： Containers running: 465; Memory used: 3.51 TB; Memory total: 6.57 TB Vcores used: 473; Vcores total: 1310 Containers running: 465; Memory used: 3.51 TB; Memory total: 6.57 TB Vcores used: 473; Vcores total: 1310 Containers running: 465; Memory used: 3.51 TB; Memory total: 6.57 TB Vcores used: 473; Vcores total: 1310你可以看到大约一半的V核和一半的RAM甚至没有被用于工作。为什么是这样？如果有工作被卡住，其他工作悬而未决，那么资源pipe理器不应该将这些工作分散到未使用的节点pipe理器中吗？这可能是我需要了解的第一个问题。

使用APACHE Web服务器，Linux CentOS访问HDFS HADOOP
SSH到localhost时清空homedir名称
Hadoop CDH4评估：哪个Ubuntu将是首选？清醒或精确
无法从init.d脚本启动Hadoop
非发行版Hadoop的监控工具

Hadoop的硬盘select
接触大数据而不必build立环境
为aws hadoop ec2设置环境variables
设置多个Hadoop集群
使用Kerberos设置Hive Remote Metastore
Hadoop单节点集群内存和存储需求
HDFS的ZKFC服务无法启动
运行任何hadoop hdfs文件系统命令时出错
Active Directory本身是否不足以保证hadoop？
Hadoop：如何configuration数据节点的故障转移时间