绝望:statd超时,lockd不能监视/不监视

从今天下午开始,服务器出现了问题。 在服务器端,我看到在dmesg消息如下:

 statd: server rpc.statd not responding, timed out lockd: cannot unmonitor <client> statd: server rpc.statd not responding, timed out lockd: cannot monitor <client> 

在客户端,我在dmesg看到:

 lockd: server <server> not responding, still trying lockd: server <server> OK 

这是瘫痪整个networking! 我已经尝试过西安build议的解决scheme ,但是没有什么区别。

服务器,Debian Linux,挤压64位:

 >> uname -a Linux <server> 2.6.32-5-amd64 #1 SMP Fri May 10 08:43:19 UTC 2013 x86_64 GNU/Linux 

客户端,Linux Mint 13-64bit:

 >> uname -a Linux <client> 3.2.0-49-generic #75-Ubuntu SMP Tue Jun 18 17:39:32 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux 

我没有在服务器上运行更新,所以我不知道可能发生了什么变化。 我没有升级我们的客户机之一,但不明白为什么会混淆服务器,因为所有的机器似乎受到影响。 有想法该怎么解决这个吗?

更新1

服务器暂时搁置一会儿

 Starting portmap deamon Starting NFS common utilities: statd idmapd 

这需要大约2分钟,直到开机继续…

更新2

这的确是客户端机器升级造成的。 它似乎停滞在服务器上,造成所有其他机器有问题。 我重新启动了整个networking,把这台机器关了,我没遇到任何问题。 不是一个修复,但我已经降级了这台机器,一切似乎是稳定的。

这里提出了几点build议:

我曾经设法打破了环回接口( lo ),并感谢它的几个服务,如NFS,停止正常工作。 如果你仍然有心爱的界面启动并运行,请参阅ifconfig 。 如果没有,请参阅/etc/network/interfaces ,看看发生了什么事情。

还有一些人已经提到,检查命令pgrep -v statdnetstat -tlnpu来查看statd是否正在运行。

或者也许有人已经改变了/etc在服务器端的东西? 如果在版本控制下没有/etc ,请查看是否有任何文件最近被修改:例如, find /etc -mtime -14会显示最近14天内更改的文件。

看看这里: http : //sophiedogg.com/lockd-and-statd-nfs-errors/

试试:

 # /etc/init.d/nfs-common stop # /etc/init.d/nfs-kernel-server stop # rm -rf /var/lib/nfs/statd/sm/* # rm -rf /var/lib/nfs/statd/sm.bak/* # /etc/init.d/nfs-common start # /etc/init.d/nfs-kernel-server start 

我有同样的问题,这解决了它,但只有一个月。 我现在不知道为什么。 我今天不得不再次删除文件。

我在一个nfs debian挤压服务器上遇到了同样的问题,而且似乎也是由一些新的客户端触发的(Fedora 20)。 降级客户端是不是我的select,经过一些漫长的,痛苦的,不成功的debugging后,我发现了一个(不同的,可能是不相关的)readdir循环错误导出ext4文件系统与大量的文件类似于: https:// bugs.launchpad.net/ubuntu/+source/linux/+bug/1240143

(我可能是错的,从小我明白这是固定在最近的内核,所以debian挤压可能会受到影响)

长话短说,至less摆脱这个错误,我升级我的nfs服务器到debian wheezy(迫使nfs版本为3),现在(与相同的文件系统和相同的客户端),这是一个星期没有“无法监控” /“没有回应”的问题(升级之前,这是一个每天的事情)

这适用于我的情况:

https://lists.debian.org/debian-user/2004/10/msg00932.html

只需编辑/etc/init.d/halt脚本,最后应该有一行

halt -d -f -i $ poweroff $ hddown

“-i”选项使得所有的networking接口都被closures,但是对于无盘客户机来说这似乎为时尚早,只是试图去除这个选项。

halt -d -f $ poweroff $ hddown

请注意,我的问题是与磁盘客户端上的NFS。