一个系统的混乱:从哪里开始?

我刚刚在一个有100多人的公司里担任唯一的“IT人物”。 这是一家历史悠久的IT公司,经过多年的努力经历了6人。 在那段时间里,每个人都没有logging任何东西,有不同的做事方式,所有的系统都设法有机地增长,因为有更多的东西被加固,没有任何努力build立一个坚实的基础。

另外一面:公司已经意识到,试图把一切都放在一个人身上一直没有奏效。 我将成为第一个雇用合适规模团队的IT人员。 另外,我们将外包一个对我们系统的总体审计,但是这个审计将只专注于我们面向客户的生产系统,而不是整个networking

一些有趣的事实:

  • 不同的供应商有各种各样的存储系统。 有一个存储系统没有保存任何凭据,并且开始失败。
  • 整个networking对我来说没有什么意义… 6个域控制器服务于一个位置/域。 多个VLAN似乎没有韵或理由。 在自己的领域有多个卫星办公室被我前任的最后几个人完全忽略了。
  • 没有备份似乎正在发生
  • Office365的服务电子邮件/ lync /共享点,但似乎并没有与活动目录同步
  • 说到活动目录。 。 。 这是一个完整的混乱。 实际上,一些古老的OU实际上已经成为问题,几乎每个人都是域pipe理员。
  • 历史上没有任何票务系统或资产追踪。
  • 全线有机器到机器的通信问题。 有一个思科ASA几乎所有的networkingstream量似乎是路由通过,它几乎没有configuration。

这些正是我第一天注意到的。 我也被告知,我们可能每个季度都有严重的严重失败。

这相当于一个相当大的挑战,我很难从哪里开始,所以我想我会在这里问问大家。 。 。 我应该从哪里开始?

你提到面向客户的系统。 这对我来说意味着您的首要任务就是让您赚钱的系统正常运行。 networking和存储听起来像#1和#2。 (编辑:)噢,和弹性。 将您的备份检出,在线testing。 确保你可以恢复它们!

接下来优先考虑内部networking和广告,需要一个坚实的基础。 根据您的信息,我会说迁移/域名崩溃是为了。 我无法想象有这样一个小组织的多个AD域的理由。

找一个项目经理。 你可能会有多个同时努力来清理。 有一个专业的协调工作。

不要害怕将这些外包给专业服务。 尽可能严格地考虑范围,如果供应商给你留下了深刻的印象,那么就要扩大参与度。

如上所述,这是一个有很多很长答案的问题。

所以,我会尽量保持很短的时间:

  1. 备份 :没有备份,如果发生什么事情,你真的有一个改变失业
  2. 存储 :检查您的存储服务器(及其磁盘)是否安全
  3. 联网 :谨慎的政策审计不应该花费太多的时间(大约1-2周)
  4. 虚拟化 :开始将物理服务器迁移到虚拟机
  5. 之后,您可以开始在软件/应用程序级别重新组织您的域 。 在这种情况下, 充分利用虚拟机快照

我会在这样的场景中寻找项目经理的帮助。 根据我的经验,首先解决networking(基础架构和逻辑),备份和安全是更好的方式来应对变化。 另外,在对环境进行任何改变之前,logging当前状态的每个方面(照片取决于具体情况)。

我的angular色和过去一样。 这是一家没有预算的政府公司。 150多台工作站和10台服务器运行在非pipe理型10/100交换机上,几乎看到了所有问题:从运行Windows NT的Pentium II到处处都是10/100的非pipe理型交换机。 把它做成一个“好”的标准是很难的,但是我在那里2年半的时间里有了很好的经验。