服务器经常挂起,我的客户希望我做X而适当的解决scheme是Y.

这个问题更多的是礼仪而不是实际的服务器问题。

由我的客户拥有的2台服务器经常停止响应(快速,然后真的很慢,因为它需要1分钟执行ls ,然后完全停止)。 我build议我们把它拿下来进行维护,但是他希望我设置一个脚本,在每次locking时重新启动它。 更糟糕的是,服务器之间相互监视,重新启动命令有一个强制性的60秒延迟(关机,等待60秒,然后启动)。 问题在于,他们两人在60秒之内locking的可能性很大。 两个关机命令都可以发送给对方,两台服务器同时closures。 没有人能够发送启动命令。 就在不久之前,由于这个确切的原因,我们有2小时的停机时间。

现在,我的客户要我“设置一个标志”,所以关机命令不会重复发送。 但是,这并不能消除同时存在的问题,服务器最终还是会一起下台。

恕我直言,重新启动服务器并不是一个好的解决scheme。 我build议我们find根本原因并解决它。 我还build议他使用watchdog但他否认将其搁置。 我甚至放弃了,说他应该启动一个小的专用服务器进行监控,但他仍然希望我这样做。

我现在的困境是,如果我应该做他提出的问题 (每当它挂起时重新启动服务器),或者只是在未经许可的情况下login到他的服务器,并应用所需的修复程序来解决问题。 正因为如此,我们无法前进。 你们有什么build议?

我build议你尽力研究,向客户解释情况和风险。 如果他还想让你按自己的方式去做,那就去做吧。 他是老板/顾客,他应该得到他想要的。 即使它没有意义。 或者,如果您担心这种情况可能会损害您的声誉或导致其他严重问题,您可以退出或拒绝为该客户提供服务。

我想我们中的很多人都是相似的,尽pipe不是很糟糕的情况。 当客户/公司决策stream入我们的工作,并把我们置于这一困难的位置。 像财政,政策,战略业务关系,缺乏教育,权力旅行和其他事情都可能是问题。 不得不去争取做正确的事情,但是当你知道错误的时候做错事情就更糟了。 人们应该来找你的专家意见。 只要确保你警告过,所以当事情变坏时,没有人会认为这是你的错。