适用于Windows 2003群集的Sane补丁程序

在一个粗粒度的计算集群中,我们已经有了一个包含75个Win2k3节点的集群。 集群在防火墙的后面,驻留在自己的VLAN中。 所有大小和types的作业都运行在集群上,所有运行的可执行文件都是定制的。

(编辑:我们的可执行文件的附加说明)作业的持续时间范围从30秒到7天,可能包含一个可执行文件或2000个子作业(短期)。 显然,我们正试图避免在7天的生产工作中IT安排重新启动的情况。

我们有一个调度软件,可以容纳粗粒度集群的所有常规任务,我们可以控制哪些机器是主动提交的。如果WSUS以某种方式可编写脚本(或者客户端可以声明它是closures的可用性),我们可以协调两个系统和帮助。

目前,补丁计划是超星期二之后的星期天,无论群集上运行什么。 每次我们想要延长机器的长时间运行生产工作时,我们必须要求豁免。 基本上,虽然我们的小组负责这些机器,但我们几乎无法控制IT的补丁安排。

  1. 每月补丁与MS的日程安排生产Windows群集理智?
  2. WSUS中是否有软件挂钩,我们可以说“请不要重新启动”?

1.每个月MS都安排一个生产Windows集群,

是的,但是一个集群不应该有一个与补丁相关的停机时间,因为它应该使作业失败到另一个节点 – 我不会同时补丁整个集群(这将是疯了)

WSUS中有软件挂钩,我们可以说“请不要重新启动”?

最终用户无法停止WSUS更新或重新启动,但在我看来,您的组和IT组之间存在真正的通信问题; 但是,您应该能够一次损失1个节点,而对生产影响不大。

通过使用Config Mgr来pipe理更新的部署,可以阻止服务器重新启动。 因此应用更新(但重启之前可能无效),IT部门将报告显示正在重启的服务器。 他们可以很容易地给你这个列表,我希望你可以很容易地安排特定节点的重启,而不会有太多的干扰。 IT部门可以轻松实现故障安全部署(强制重新启动)以及长时间的截止时间,所以如果您不能保持讨价还价的优势,最终会迫使更新和重新启动。

对于标准更新部署,IT(和您)可能需要完全静默(非重新启动部署)的非常短的最后期限,以及稍微更长的截止时间部署,这是不安静的,所以如果您login到服务器,您将看到通知。 这些部署都不应强制重新启动。

您仍然可能遇到这样的情况,即某个库或其他代码组件在不使用时更新,然后在重新启动之前使用,导致其余更新生效,从而导致某些内容失败。

这是一种有效的方式来获得您和您的IT需求,并且你们每个人都有一些关于正在发生的事情的可见性。 根据部署情况报告哪些服务器处于什么状态对于你们双方都是非常有用的。

听起来你正在从你的IT部门那里得到很多“交涉”的态度。 你需要坐下来(或者用啤酒贿赂他们?)解释你的情况,看看他们是否可以做一些事情,比如创build一个下游的WSUS服务器,并且手动补丁批准。

WSUS的设置均由组策略设置,这些设置位于域或OU级别的活动目录中。 如果服务器在公司域中,没有单独的OU,那么他们就会得到其他人所得到的,听起来不合适。

如果您的IT部门无法解决问题,请从域中删除计算机?