我们有一个在远程数据中心中作为Web服务器运行的Windows Server 2003框。 昨晚我安装了一大批Windows Update,然后在凌晨1:30左右通过RDP重启。 重启失败,虽然服务器仍在运行,但是我们通过RDP被locking。 提示恐慌和混乱!
我没有将应用程序路由到另一台机器上(这只是当前设备的一部分),因为几个小时的停机时间对于我们的客户来说是可以接受的。
现在,我正在联络数据中心的工作人员,通过其他方式在今晚晚些时候重新启动机器,但显然我希望在未来避免这种情况。
我的问题:
机器的细节:
提前致谢。 更多信息请求。
更新 :
这里有一些很好的答案。
对于远程pipe理,有几个人build议使用基于IP的KVM和远程电源pipe理,或者HP的iLO或Dell的DRAC等硬件。 我们有惠普服务器,所以我会考虑到iLO。 令人激动的是,我们的托pipe中心为其所有机器都configuration了KVM over IP,但由于安装不当,无法访问客户。 在select未来的托pipe服务时,我会确定情况并非如此。
为了预防, mhbuild议停止服务和closures可能阻止重新启动的会话。 在我们的情况下,可能会发现问题并阻止问题。 运行我们的临时环境的VMware实例似乎没有closures,停止了主服务器的重新启动。
John Gardeniersbuild议安装更新后手动执行重新引导,并且不要让Windows Update执行重新引导。 我将来会这样做的。
感谢大家。
有几个远程访问控制台的选项,而不依赖RDP进行工作的Windows安装:
熄灯pipe理 – 来自Sun,HP,IBM和其他一些服务器的服务器具有熄灯pipe理芯片(LOM)。 我在惠普的iLO技术方面有很多经验,为我省下了好几笔。 从本质上讲,这个芯片可以让你对服务器前端的控件进行authentication的远程访问,而且大多数情况下更多。 不好的一面是,如果你的服务器没有它,你不能使用它。
IP KVM或远程电源pipe理 – 几家供应商提供的产品允许您通过远程访问键盘,video和鼠标( IP KVM ),或者通过将主电源closures再打开来远程pipe理远程供电一个PDU 。 后面的选项是不推荐的,除非你确定简单的电源循环服务器将有所帮助。
最后的select是不要在一夜之间安装更新,并安排在您或您的“双手和双眼”可以在数据中心解决任何问题的白天短暂中断。 这确实是你客户的心血来潮,尽pipe停机时间通常是build立在你的协议上的一件好事。
如果您的服务器是Dell或HP,则可以使用BMC(Dell)或ILO(HP)控制器进行远程硬复位。 戴尔和惠普都有一个更昂贵的选项,为您提供远程键盘和屏幕。 使用戴尔,您可以安装DRAC卡,使用惠普(HP),我认为您只需安装许可证密钥即可启用额外的function。
如果服务器不是戴尔或惠普,则卡住了。 其他一些服务器也有类似的遥控器,但很多都没有。 服务器偶尔会在重新启动时执行,通常我无法看到。 唯一的办法是只使用服务器来运行虚拟机,确保它没有看到互联网,并且从不更新(或者只在受控的条件下)。 如果虚拟机无法正常启动,则可以轻松地从主机重新启动虚拟机。
JR
重新启动,它是应用补丁的一部分? 我已经有好几次允许更新过程执行重新启动,导致机器最终没有完全closures,就像你所描述的那样。 在大多数情况下,所需要的只是鼠标的按键或移动,尽pipe屏幕上没有任何提示。 不幸的是,我离开办公室时总是发生这种情况。 这些天我使用脚本安装更新,但不允许在最后重新启动。 重新启动是单独执行的。 自那以后,我再也没有任何麻烦了。
我之前在我们的数据中心遇到过同样的问题,幸运的是我的惠普服务器中有一个iLO卡,我的戴尔机箱中有一个DRAC,但其中一个盒子没有任何远程pipe理。 我唯一能做的就是打电话给数据中心,询问他们中的一个人是否可以closures电源并为我启动。
对于服务器重启,我总是做的第一件事是确保我在重启过程中。 如果我不能亲自到场,至less我能够平静下来,这样我就可以观察到它正在下降并回来。
在重新启动之前,我停止服务。 尽可能多地确保只有最基本的服务列表在发生故障时正常运行。 这包括任何网站,电子邮件,AV,安全代理,类似的东西。 大多数我看到的“停滞不前”的情况可以直接归因于服务在重启期间陷入“停止”状态,并且这避免了它。 这是唯一最有用的事情,不幸的是没有明确的适用于所有服务的列表, 经验和你自己的服务器上的知识是必需的。
然后,我将检查是否有任何其他可能仍然存在的RDP会话。 断开但未注销的会话可能仍然会加载用户configuration文件。 另外检查是否有任何其他连接可能是活动的服务器。
然后我重新启动,并在重新启动时,我会启动命令提示符,并ping它。 我通常不需要在这个阶段看到屏幕上显示的内容,但是如果你有必要的先决条件,它可能会很有用。
偶尔,如果服务器在重新启动期间挂起,我可以通过计算机pipe理得到它,并且 – 正如我上面所说的 – find一个停止在“停止”状态的服务。 远程的“杀死”工具可以在这里派上用场。
大多数情况下,我们将尽快重新启动补丁程序。 推送补丁程序并等待更适当的时机重新启动只会造成问题。 所有其他人都提供了优秀的,尝试和真实的方法来重新启动一个任性的盒子。 国际劳工组织和DRAC是伟大的,使用PSTools关机工具也是一个好主意。 我发现,有时正常的方法失败,但使用像VNC或Dameware的东西,让我login到盒子,踢它。
如果你有两台远程服务器(假设他们可以互相交谈),可以在另一台服务器上运行
Shutdown /m \\Server /r /c "Remote Restart" /t 30
(对于Win2000,有RCMD(资源工具包的一部分)为我节省了几次,但我不认为这是一个选项)。
有一件事没有提到,但是我记得至less有两种情况对我有用,就是WakeOnLAN–如果你的数据中心里至less有两台服务器在同一个局域网中。
在Serverfault.com上看到这个问题: Wake on LAN for Windows
我们通常使用Windows远程桌面进行远程pipe理,但是我们大多数远程服务器上都有Radmin( http://www.radmin.com/ )。 在罕见的情况下,系统将通过Radmin提供,而不是RDP。 这可以是一个生命的救星。 你也可以尝试VNC。 当然,你将不得不考虑其中任何一个的安全方面。