NFS自动挂载失败的最常见原因是什么?

当然,我需要解决一个特定的问题,但是我希望能够提供一些关于“如何解决自动安装nfs问题”的一般答案,以帮助更多的人出现类似的症状。

我们有一个文件服务器'nas1'和三个客户端服务器'server1','server2','server3',它们包含以下这行:/etc/auto.master文件。

/net -hosts acregmax=10,acdirmax=10 

所有的服务器都运行CentOS 5。

'nas1'在/ etc / exports中具有以下内容:

 /proj/ptn *(sync,rw,no_root_squash) 

其中一台服务器已经正常运行,没有任何问题,但两次相隔几个星期,我们遇到了挂载点在客户端服务器上显示为空的问题。

对于“server3”无法使用“/ net / nas1 / proj / ptn”的情况,以下是一些有助于排除故障的方法:

 ssh nas1 

按预期工作,显然连接不会在两者之间丢失。 当nfs mount无法访问时,并没有发生,但值得一提的是,我们有一个间歇性的问题(平均每周一次),服务器变得没有反应,必须重新启动才能恢复。 这变得很明显,因为负载均衡服务器正在不断检查服务器的连接,以跟踪其可用的服务器池。

 lsof | grep /proj/ptn automount 3414 root 5r DIR 0,19 0 13390 /net/nas1/proj/ptn cat /proc/mounts 

包括/etc/auto.misc/misc autofs rw,fd = 7,pgrp = 3414,timeout = 300,minproto = 5,maxproto = 5,间接0 0 -hosts / net autofs rw,fd = 13,pgrp = 3414, timeout = 300,minproto = 5,maxproto = 5,indirect 0 0 -hosts / net / nas1 / proj / ptn autofs rw,fd = 13,pgrp = 3414,timeout = 300,minproto = 5,maxproto = 5,offset 0 0

 service autofs restart Stopping automount: [ OK ] Starting automount: [ OK ] 

这并没有解决问题,但允许卸载:

 umount /net/nas1/proj/ptn mount /net/nas1/proj/ptn mount: can't find /net/nas1/proj/ptn in /etc/fstab or /etc/mtab 

挂载行为是预期的,但它被尝试,所以我包括它。

 service network restart Shutting down interface eth0: [ OK ] Shutting down loopback interface: [ OK ] Bringing up loopback interface: [ OK ] Bringing up interface eth0: [ OK ] 

没有帮助。

 /etc/init.d/autofs restart Stopping automount: [ OK ] Starting automount: [ OK ] 

这把它带回来了。

由于之前已经运行了“service autofs restart”,所以“/etc/init.d/autofs restart”的工作原理是未知的,除非它与“umount”和“service network restart”之间的事实有关。

考虑到我们再次看到这种情况可能还有几周的时间,下一次或下一次尝试时最好的办法是确保它永远不会再次下降? 人们会希望AUTO mount会在挂载时自动修复挂载:-(

  • 尝试安装文件系统的客户太多
  • networking问题
  • 文件系统上的活动过多
  • 服务器由于高负载而没有响应