为什么重新启动大型机尤其糟糕?

这是我在整个职业生涯中经常听到的事情,从几乎所有我曾经使用过的大型主机操作员/pipe理员,直到现在,我从来没有真正质疑过这个问题,或者有理由关心这种或那种方式。 不要重新启动一个大型机,因为这是一个非常糟糕的异端,它会带来各种各样的风险和问题,而且每次有人重新启动大型机时,IBM都会杀死一只小狗。 (无论如何,这些线路上还是有的。)

那么最近,我被迫进入了一个有理由去关心的局面,我越想越觉得它越来越没有意义。 大型机硬件的devise是有弹性的,这些东西上的操作系统就像你可以得到的一样稳定,而且我敢肯定,IBM每次重新启动iSeries时实际上都没有大量的小狗来谋杀。

当然,我得到的服务器重启一般是不好的练习,或者是最后的select,或者是你应该做的事情,当应召人员排起了热date,但我目前正在跳过各种疯狂的箍,以避免重新启动一个iSeries,因为…好吧,“就因为”,似乎。

考虑到这一点,任何拥有大型机经验的人都可以解释重启大型机的技术原因与重新启动* nix或Windows服务器相比是特别糟糕的吗?

在任何重新启动不经常的情况下,重新启动往往会出现在正常运行时不会出现的各种不幸的软件错误。 由于这些不经常出现,他们不会被注意到,因此不会被修复。 重新启动时间是非常可怕的事情。

另一个问题是大型机往往会做很多不同的事情,所以重新启动大型机可能会在很长一段时间内淘汰大量不同的系统。 根据当前的情况,在重新启动时,您可能会将整个业务closures10分钟。

我不知道这是否广泛适用,但是在我工作过的那两个有程序员的大型机上,重新启动是由于手动工作量太大而导致的。重启。 诸如将通信问题修复到其他系统,处理磁盘上不一致的数据等。

在我看来(不是一个大型机程序员)这些都是写得不好的软件的迹象。 我是说,来吧! 磁盘上的数据不一致!? 这不像我拉你的电源线。 我给你通知干净closures!

YMMV,但这是我的经验。

那么,两个项目。

首先,记住大型机是复杂的,并不一定所有的软件都会阻止重新启动 – 你可能遇到很多问题,只是在某些事情中被中断的进程。 手动清理时间。 一些大型机正在积极开发,以避免 – 像事务性内存更新(如果编程正确)和处理器允许热插拔处理器;)

其次,当你谈到重启时,一定要知道你在说什么。 几乎每个主机运行VMS或类似的东西。 VMS是“最初的pipe理程序 – 就像VmWare上的steroits,以及50年前的那样)。

重新启动意味着什么? 重新启动MAINFRAME,或重新启动虚拟机中的操作系统实例? ;)

我会假设重新启动一个大型机是很less有必要的,主要是因为(a)你在虚拟机中的所有东西,(b)即使是大多数硬件故障也不需要核心重启。