SMF的哪一部分很可能会被硬盘掉电?

在我的一个客户站点,当地的人closures了他们的本地Solaris 10 x86服务器,拉动了电源input,移动了它,现在无法正常启动。 它会引导,然后显示一个提示,让您login。这似乎是单用户里程碑(或同等)。

挖掘它,我认为SMF不允许系统去多用户。 SMF在autofs上产生了大量的错误,在一些愚弄之后,我得到它在inetd和nfs / client上产生错误。 这一切都告诉我,问题是在一些SMF状态文件或数据库,需要修复/删除/重新创build或什么的,但我不知道实际问题是什么。

通过“生成错误”,我的意思是我每秒钟都会在控制台上看到一条消息,说“方法或服务退出超时。 杀死合同<#>“这使得与电脑的交互变得困难。

运行svcs -xv将服务显示为“启用”,处于状态“禁用”,原因“启动方法正在运行”。 在服务上与svcadm鬼混什么都不做,除非确认服务不在维护状态。

login/ lib / svc / log / $ SERVICE只是告诉你这个循环每秒发生一次。 login/ etc / svc / volatile / $ SERVICE确认在启动时服务试图启动,并立即停止,不再进行input。 请注意,系统日志不会启动,因为系统日志依赖于autofs,所以我没有syslog或dmesg。

谷歌search所有这些术语最终告诉我如何debugging/修复autofs或nfs / client或inetd或rpc / gss(这是SMF用来阻止nfs / client“启动”的借口,这是声称rpc / gss是“undefined”,这是不正确的,因为这一切都工作。我重新启用inetadm,但inetd仍然无法正常启动)。 但我认为问题是一般的SMF,而不是个别的服务。

对“manifest_import”执行restore_repository不会改善,甚至可以改变情况。 我没有使用启动备份,因为最后一次启动没有用。

我已经告诉客户,由于有价值的数据目录是在一个单独的文件系统上(fsck是干净的,因此完好无损),我们可以在/分区上重新安装solaris 10。 但是,这似乎是一个非常类似于Windows的解决scheme来解决这个问题。

所以。 任何想法什么是坏了,我怎么可能解决它?

更新1 :我应该提到这个系统有两个文件系统,/和/ export。 这两个fsck清洁和正确安装。

这种问题的一个常见根本原因是由于某些文件系统损坏而导致挂载文件系统时出现问题。 这种情况已经非常罕见了,尤其是对于本地用户而言,但是,客户并没有因为禁用ufs日志logging(这可以避免由于突然断电造成的大部分文件系统损坏)和不使用ZFS(其中不能被devise腐败)。

您可以通过编辑/boot/grub/menu.lst启用详细的smf启动。 确切的方法取决于你的Solaris版本和更新,但通常,这是通过在加载内核的行中用console=text -v -m verbosereplaceconsole=graphics来完成的。

如果要以单用户模式启动,请使用console=text -v -m verbose,milestone=single-user

要启用smfdebugging模式,请使用console=text -v -m debug

请注意,您可以使用grub编辑模式临时设置这些选项。