系统pipe理领域有没有一些众所周知的反模式?

我知道几个常见的模式,几乎每个项目在其生命周期的某个阶段都会变得黯淡无光:

  1. 无法中断
  2. 第三方组件locking升级
  3. 非统一的环境
  4. 缺乏监测和警报
  5. 缺less冗余
  6. 缺乏能力
  7. 变更pipe理不善
  8. 太自由或严格的访问政策
  9. 组织变更对基础架构所有权造成不利影响

我希望在书或网站上总结出一些清晰的反模式图书馆。 我几乎积极地看到,许多组织正在通过消防方法进行试验性的学习。 如果不是,我们开始吧。

使自动化任务保持自动化,直到手工完成自动化任务所需的时间足够长,以至于无法自动化,因为人工任务一直在进行。

相反,过早的自动化。 绝对不需要花费3N小时来自动执行需要N小时才能手动完成的一次性任务(即使是通过手动方式来进行自动化而不是自动化)。

答:没有testing恢复 – 备份可以确定和确定,但如何恢复?

需要多长时间? 你必须知道在压力的情况下这样做…

B.没有configurationpipe理,没有统一 – 只是在这里和那里的变化,我想我已经在这里调整了一些…

谁知道如何复制一个做得好的服务器,如果所有的怪癖都没有写下来,并且在店里没有相同的configuration? 如果您成功恢复数据,但不configuration应用程序呢?

C.没有监控 – 不知道如何以及在做什么

这是双重的:a)必须监视警报,以便在耗尽某些资源或奇怪的行为之前及时做出反应,并且b)必须监视长期趋势以pipe理容量(磁盘,CPU,RAM,networking等)。 ..)。

D.你的cfg没有冗余 – 当XX死亡时会发生什么情况

这意味着提前计划你想要的系统pipe理员。

对我来说这些是最重要的。

最具杀伤力的模式是系统pipe理部门(或整个IT)成为公司的被动参与者。 也就是说,他们被看作是一种自助式的服务,每个人都已经形成了应该怎样做的想法,这只考虑用户的需求,而不是整个IT生态系统的需求。

第二大杀手模式是系统pipe理部门变成一堆button式button,即所有的软件/工具都是由第三方购买或开发安装的,系统pipe理员得到正式的培训和手册,然后只遵循操作手册和升级到供应商的一切不明确的手册。 这种情况对于(甚至是大多数)系统pipe理员来说可能是非常舒适的,但是如果没有人真正知道整个系统如何实际工作,这将是一场灾难,等待发生。供应商之间的责备游戏)。

1)过度承诺和交付不足(即保持用户期望的现实)

2)在需要之前不validation备份。

编辑:我打算编号2包括文件/数据的恢复

不监控上次login时间> 30天的AD帐户使用模式

(我们必须这样做,审计的原因,但结果是相当震撼)

  • 将关键信息保存在一个人的头部/收件箱/文档文件夹中。 如果重要的是,像供应商的联系方式,许可证密钥,设置说明,它必须提供给有权限的部门中的每个人,可能需要访问它,并在一个标准的地方。

  • 询问谁知道什么来logging它。 这听起来不错,因为他们是有知识的人,但实际上却是不好的,因为他们不能很容易地知道重要的知识是什么。 最好是与他人达成新的协议,向知情人询问他们需要的任何信息,并让他们logging下来。

  • 不清楚的文件。 任何人都可以在整个IT部门可以讨论的时候解决一个中等优先级的问题。 在深夜解决高优先级的问题时,你几乎是孤身一人,而又不知道为什么系统设置如此,或者为什么它不符合文档所述,这是另一回事。

  • 没有很好地跟踪密码。 所以你很快就需要一个账号,用一个随机的密码创build一个账号,然后在18个月之后,这个账号还在使用中,没有人知道密码或者哪个服务会被改变。

  • 不购买关键系统的供应商支持,因为它“太贵”。

  • 不适当的重点 IT人员应该以pipe理人员为导向 – 哪个项目是优先事项的协议,哪个系统是最先需要的,应该到位。 如果IT试图修复业务系统,pipe理层要求电子邮件,用户要求处理订单,这是一个混乱的秘诀。

  • 不适当的解决scheme – IT部门很容易陷入“解决问题,IT系统必须工作得更早”的心态,因为pipe理IT协议可能更适合“尝试2小时,如果不是固定的,那么即使看起来很有希望也要停下来,然后从备份恢复。“

  • 各处testing文件的副本。 你不想打开一个运行业务系统或网站的文件夹,看到“网站新/网站当前/网站复制/网站testing/网站testing戴夫/网站使用 – 开发,生产和testing应该存在,并且应该与涉及的每个部门(IT,开发,项目pipe理等)分开,知道应该在哪里并且同意如何改变被批准。也用于configuration文件。

  • 变更批准 – 即使你只是先口头讨论,不要改变重要的东西,没有任何人知道的工作方式。 由你决定什么“重要”涵盖您的情况。

  • 缓解的解决scheme长期留在原地。 我知道你用这个旧电话线把这个服务器连接到了这个networking上,所以你可以解决一个紧急的问题。 我知道你没有时间正确地重做。 打发时间。

  • 与公司其他部门的关系不好。 IT是一项帮助公司其他部门完成工作的服务。 如果他们需要大量的文件,那就让它发生。 如果你需要pipe理层的批准来购买硬件,那就去吧。 如果你不能得到它,清楚地沟通,巨大的文件不能快速移动,因为pipe理层已经优先考虑其他一些开支。 如果您出于法律原因而需要存档,但没有预算,那么您需要尽可能将档案归档到您的系统中。