您已经实施的哪些更改对于节省每日系统pipe理员工作负载中的时间有最大的影响? 你有什么诀窍可以提高工作效率,完成更多的工作或者减less工作量以达到相同的结果?
我正在考虑自动化,工作stream程/stream程的变化,新工具,完全停止做一些事情,外包,更好的授权,改变软件/硬件,减less官僚作风等等。
监控+警报 – 这是一个很好的安全网。 就像开发人员编写unit testing以确保在更新代码时不会搞砸一样,我依靠监视作为附加的安全networking,以防万一我搞砸了一些东西(即断开服务器,拒绝防火墙上的生产stream量等) 。 它让人安心 – 如果事情破裂,我会在客户打电话之前知道。
对我来说,这是集中authentication。
我到了pipe理40个左右的Slackware机器的地步,每个人都有本地authenticationPLUS本地Sambaauthentication。 我也有一个VPN解决scheme,每个帐户需要设置,加上一个内部的jabber服务器和一个内部的电子邮件服务器。 一切都有自己的账户。 MAC(移动,增加,变化)是疯狂的。
所以我从Slackware切换到CentOS,创build了一个Active Directory基础架构,并使用了Likewise Open来对所有的Linux机器进行ADauthentication。 它可能每月保存20小时,甚至不开玩笑。
现在,我已经通过ADauthentication了所有的东西,而且它的function非常强大。 如果你还在做一些糟糕的老办法,我不能推荐集中authentication。
我同意这里的明显select。 自动化和中央authentication。 但是,看来我必须成为提供文档的人 。
通过logging尽可能多的问题,工作stream程,安装和指南,尽可能的人们能够解决他们的一些问题,而不需要我们的部门。
另一个很好的节省时间是问题跟踪 。
能够优先考虑任务,将其分配给团队成员,并通过电子邮件,MSN或简单地来到办公室摆脱所有的请求发送的人。 这也可以帮助我们的好朋友,pipe理者看到你是多么有效率(如果你想的话)。
那么当然,蛋糕上的糖霜会成为我的'RTFM'(阅读精细手册)杯,提高了很多。
使用像Chef或Puppet这样的工具进行基础设施自动化是我在pipe理的系统上实现的最好的事情。 监控是伟大的,但所有,但经常,获得不同的位与基础设施的其余部分打好需要大量的工作。 厨师和木偶在自动化整个基础设施方面都非常出色,提供了大量以前用手写的粘合剂。 特别是将哪些服务器提供什么服务。
Chef内置了查询服务器在其他节点上应用的属性和配方的function,因此您可以询问生产Web服务器是谁,或者数据库主是谁,从而使自动化变得更容易。 木偶也可以做到这一点,但它需要像iClassify一样的外部节点分类工具。
这应该对Nagios和Munin等监控和趋势分析工具产生明显的影响。 例如,它也可以提供负载平衡环境的自动configuration,因此LB可以查询需要为特定应用程序覆盖的所有Web服务器。
我在各种环境中实现的另一大节省时间的工具是自动构build,比如kickstart(redhat / centos)和preseed(debian / ubuntu)。 这对大多数人来说应该是显而易见的,但是令人惊讶的是有多less网站仍然可以通过交付CD来构build系统。 如果自动构build让系统准备好运行Chef或Puppet来获得所有其他货物,那更好。
多个监视器,在我负责的每个服务器的控制台上打开一个窗口。
当然,监控是很好的,但不知道这是节省时间的。 对于我的钱来说,这是集中式日志logging,一个查看系统过滤了世俗,突出危险(磁盘故障,病毒扫描程序find),并显示其他所有的分类。
syslog(和perl)为win。
它基本上允许我一边吃着百吉饼,一边阅读networking上所有电脑的事件日志; 至less一个粗略的检查来寻找任何可怕的东西。 巨大的时间节省。
删除了所有用户的本地pipe理员权限。 (如果我能)
这样做的效果现在我不必处理任何的,我怎么得到X应用程序安装(因为你现在不允许),我的电脑有病毒/间谍软件,我的电脑运行缓慢和几乎所有相关的东西。
我从来没有想到这个工作站的稳定性,直到我遇到一个在审计,Windows更新等方面完全漏掉的工作站。它已经运行了大约4年,没有对它做任何更新。 我想我是在Windows SP1上。 这个网站从来没有抱怨过任何问题,当我发现它,我发现它运行的很好。
虚拟化(VMware)
在从模板部署服务器,从单一界面pipe理服务器,基础设施客户端内置的详细硬件监控之间,它确实改变了我们pipe理基础设施的方式。
而它对我们如何看待我们“硬件”的影响确实使它变成了游戏规则。 集群不再“太贵”,因为我们可以虚拟部署它们。 需要更多的Citrix服务器,克隆它。 只要我们保持我们的物理硬件农场提供足够的资源(那些服务器现在是真正的商品),一切都是非常好的。
cfengine在debian / linux下进行configurationpipe理。
openvpn连接卫星站
tighvnc通过vpn到达卫星站的2300个Windows客户端。
munin和nagios进行监测和报告
用于自动健康检查的服务器上的smartmontools (和状态邮件,如果出现错误)
raid1(镜像)在服务器上。 如果一个磁盘发生故障,服务器仍在运行 – 这对我的时间pipe理来说确实很重要。
团队合作 – 独立完成所有的事情是没用的。 分享工作,一起工作更有成效。
工作氛围尊重你的伴侣,开玩笑和笑 – 这是一个积极和创造性的氛围非常有用。
享受你的工作! 男人,我爱我的工作! 这使我真的goog(我认为;))
对我来说,这是雇用一个非常好的系统pipe理员。
木偶。 改变一个地方,让所有受影响的系统的想法是太棒了。
再加上标准安装,而且新系统的运行速度非常快。 你netboot并运行一个股票安装,然后puppet接pipe和everthingconfiguration。
最后,标准化。 不,你真的不想要35个不同的Linux发行版和4个不同的Solaris版本。 工作转移到一个标准的安装。 您closures的每个独特系统都可以节省您的时间。
为监测添加另一个投票。 原理很简单:我想知道用户受到影响之前发生了什么。 系统pipe理应该是一个透明的angular色。 用户不应该知道也不关心你在做什么。 从他们的angular度来看,这只是简单的工作。 快乐和满意的用户应该平等快乐和满意的pipe理员。
IT中经常被忽视的一件事是计算机在那里为我们工作,而不是相反。 尽pipe如此,我知道pipe理员会花大量时间手动检查服务器和日志。 为什么? 计算机可以相互监视,只需要一点点脚本就可以把日志里有趣的部分传送给你。 实际上,您不需要通过几百万条信息条目,例如Fred的打印作业或DNS传输成功。 只要告诉我,当他们不是。
我实施的最大节省时间是我们生产工作站的磁盘映像。 他们都是一样的,没有人在本地存储任何东西,所以如果有一个问题,我只是重新塑造机器的形象,这一切都将成为新的。
系统停机时节省的时间是最重要的。
我将标准化文本文件中的所有支持合同信息logging在标准目录结构中。 我有一个中心,并保持不止一个副本。
以旧.ini格式(标签:数据)标准标签前的每一位信息(networking门户,电话号码,联系人,到期date,合同号码,电话菜单快捷方式等)。
find一个电话号码就像去顶层目录一样简单,并运行:
grep Phone */*support.txt | more
第一个通配符扩展到供应商和/或产品名称。
我没有使用Excel,Word,OpenOffice,数据库等等,只是因为当某些事情停滞时,那些东西可能就是支持您的支持信息的东西。 而且这些不容易从文本模式控制台屏幕查看。
我也以同样的方式logging了所有的操作方法。
几年前,我实施了一个IT部门Wiki(对那些感兴趣的人使用Mediawiki)。 当我们开始习惯使用它的时候,在办公室周围问了许多问题的答复是“你检查了维基? 我们花了一点时间习惯于检查Wiki的具体信息,但一旦我们意识到这是巨大的潜力。 我们掌握了所有我们需要的信息 – 如果有些东西不在那里,我们可以快速添加/更改页面。
到目前为止,我最大的节省时间是在IBM关于OpenSSH密钥pipe理的文章中描述的SSH密钥+ ssh-agent + keychain
没有更多的shell,脚本和scp密码。
注意:我的私钥仍然有密码。
我必须同意监督方面的情况。
尽pipe我们还没有看到全面的好处,但是使用Puppet实现configurationpipe理有希望为我们节省大量时间并大量减less错误。
我发现AutoIt和后来的AutoHotkey并坠入爱河。
我的最后一份工作是定制汽车制造商。 汇编程序是微不足道的计算机用户,并设法使他们不得不使用的程序进入他们所在的工作。 每天都有好几次,我不得不到三个不同的build筑物里去15个以上的工作站,然后杀掉崩溃的程序,然后重新启动,然后回到数据input屏幕。 我最终安装了VNC,所以我可以远程执行它,减less了旅行时间,但仍然让我记得每隔一段时间就要进行一次机器重置。 当我发现AutoIt时,我意识到我可以设置程序来观看计算机,如果5分钟内没有任何input,它可以重置程序和types,并点击所需的一切,使其返回到input屏幕。 这样做至less为我节省了一个小时,使得财务非常开心,因为没有人抱怨计算机被closures,更多的人正在input他们的工作数据。
++用于中央authentication和账户pipe理,包括账户创build和终止处理。 我们有AD(两个林)和LDAP(直到最近NDS),有不同的组访问两个目录中的资源。 我们花时间同步获取目录并获取在其中一个或另一个目录中pipe理的所有资源的时间是值得的。
无论是账户清理,configuration集中还是你有什么,下一个最大的胜利都是自动化的。
我不确定实际监控节省多less时间,但这是至关重要的。 对于一个足够大或足够复杂的环境来说,“手动检查”是不可能和无效的。 另外,有时候睡觉很好。 ;)
这可能有点偏离了这个想法的主要脉络,但是当我们对硬件平台进行标准化时,我们也取得了巨大的成功。 我们select了一个适用于我们所有操作系统的服务器平台,并坚持了好几年。 我们学习了硬件,并且学习了它的远程pipe理,它以各种方式节省时间和精力:
标准,logging和审查的操作系统版本也一样。 可能看起来很基本,但是我经常碰到商店经常出现的情况,那些工具不是标准的,而且也不能随便找出这个工具或工具是否存在,或者某个特定的服务器是否有正确的设置。 这种混乱甚至可以把最基本的任务和问题变成扑朔迷离。
学会委托和信任我的同事 – 一旦你知道你可以把一些工作交给别人,生活就会变得更加轻松。 而不是因为我很懒惰而让其他人为我做我的工作; 知道自己拥有良好的备份,这是安心的。 当然,在标准硬件上,监控得很好,标准化的操作系统configuration。 不言而喻。
我的自动化目标一直是,现在我再次收到一封电子邮件,里面写着“这样 – 在服务器上坏了,已经修好了”。 然后一旦我把错误发送给开发者,我就可以回头看报纸和喝咖啡了。 我们还没到,但是我们离日常斗争中的反应混乱还有很长一段距离。
我最近在工作中实现了AntHill Pro ,现在已经完成了我们的所有构build和部署,完成了许多项目的自动化和跟踪。 这包括创build所有项目使用的共享Tomcat部署Ant库,简化AHP中这些项目的维护。 接下来是为站点CDA部署创build一个类似的库。
虽然不省时,但节省了开发人员和操作人员的时间。 我喜欢成为别人的车轮上的油jar头。 🙂
我希望看看厨师和木偶旁边的帮助在自动化的东西的基础设施方面。
哦,文件是巨大的帮助。 这样可以节省很多时间,只需要人们写出一个写得好的文档,而不是回答同样的问题20次。
我最大的时间节省是预先安装我们的Linux工作站的脚本。 我们有承包商来来往往,所以我们有一个定期重复使用的工作站池。 当他们回到IT时,我们把安装光盘放进去,将预先安装的文件添加到安装命令中,在20分钟内(没有人从我们任何人那里得到更多的击键),这个盒子被重新安装工具和预先configuration在我们的networking中运行。 即插即用。