我们正在寻找简短的清单/模板,以显示变化实际上已经工作,并没有破坏任何东西。 这是作为更正式变更pipe理stream程的一部分而引入的。 任何人都有这样做的经验,什么工作。
手动更改validation适用于较低系统pipe理员。 真正的BOFH自动化。
我们所有的系统都是全面的(而且我的意思是全面的,比如说“这个系统上的所有网卡都是以千兆速度运行的”),而且我们所有的改变都以“确保监视在时间上是清晰的X“(其中”时间X“是”维护窗口的结束时间less于预计的回滚时间加上模糊系数,因为一切都比预期的更长,甚至回滚“)。
如果由于某种原因我们的系统正在改变的部分还没有得到全面的监控,那么变革计划的第一步就是“改进监控”(详细列出需要监控什么,如何,为什么和细节的方式其中监测响应文件需要改进以匹配)。
这个好处有好几个:
一个简单的从起点到完全监控乌托邦的计划就是build立一个监控基础架构,然后对每个变更计划进行第一步“设置监控我将要改变的服务”。 无论如何 ,编写和执行一个全面的testing计划所花费的时间并不长,而且好处是长期的(监控是永恒的,而且永远是不变的,下一次你必须改变一些东西,节省写作时间并执行另一个testing计划)。