敏捷的系统pipe理员和devops – 如何完成?

如今,敏捷系统pipe理和开发是一些关于系统pipe理和运营的热门话题。 这两个概念主要集中在缩小操作/系统pipe理员和项目 (开发人员,业务等) 之间的差距上 。 即使你从来没有听说过devops概念,我相信这个话题也是你的关注。

那么,你们用什么工具和技术来完成你们公司的事? 我对变更pipe理,持续集成和自动化等话题特别感兴趣,但不仅仅是这些话题。 请分享你的想法。 我期待着阅读你的答案/意见:)

  • svn / git – 版本控制,显然。

  • trac / redmine / jira – 票务。

  • 补鞋匠 – 用于基本操作系统服务器configuration。 补鞋匠是一个红帽家庭为重点的产品,但我敢肯定有类似的debian / Ubuntu的东西。 同样,大多数像RightScale这样的“云控制面板”公司都会为你提供这个服务。 这里的口号是“JEOS”或者“恰到好处的操作系统”。 我的路线是在我的kickstarts中使用“%packages –nobase”行,然后通过…build立我的特定堆栈。

  • 木偶/厨师 – 用于configurationpipe理和一致性执行。 这里还有其他的select,重要的是你使用一个比哪个更重要。 我发现一个特别重要的技巧是将configuration存储在开发人员使用的相同版本控制系统中。 这有助于将两个团队的工作stream程合并在一起,并使其彼此可见。

  • func(或capistrano或cluster-ssh) – 用于跨群集运行部署脚本。 这里的诀窍就是让高级开发人员能够自己去推动新事物的生活,并推动不可避免的修复。
    这实际上是devops的核心,使开发人员能够打破和修复环境。 许多系统pipe理员太耗力了,不愿意这样放手,或者他们的pipe理人员仍然对系统pipe理员应该监pipe开发者的错误观念(即使我们甚至可以读一半他们正在做的事情)。

  • 仙人掌/神经节/ collectd / munin – 图是soooooo的关键。 它的指标的商业价值与简单的视觉效果的人类价值。 将代码推送的时间戳与图表中的更改时间戳相关联,对性能回归进行故障排除和查看有关性能决策的真实事实非常有价值。 这里有一个关键点,那就是图表需要被开发人员及其pipe理层所需要的易于查看和使用,以期望得到它们。

  • nagios / zabbix / smokeping / etc – 监视服务器的内容和“基本页面”types的性能指标。 这些graphics又是关键。 这些更多的是球队的运作方面。

  • gomez / keynote / browsermob – 全面浏览器性能的外部监控,考虑到第三方服务,CDN和呈现时间问题。 这些对于开发团队来说更是如此。

这是一个混合的工具和技术,专注于技术。 特别是从“pipe理员”到“操作”的devPos的“系统pipe理员”方面的思维方式的改变。 它关于使开发人员。 使他们能够做事,使他们能够解决问题,使他们能够看到他们所做的事情/指标/图表。 相反,开发者需要接受他们已经被启用,并且实际上完成观察性能趋势,debugging问题,思考不仅仅是特征,而是如何推出以及它们将如何影响整个系统/环境的健康的工作。

我们正在美国国家仪器公司做这件事情。 你可以在http://dev2ops.org/blog/2010/4/27/qa-ernest-mueller-on-bringing-agile-to-operations.html上阅读更多关于我们正在做的事情。

在这里,笼子里提到的工具组合基本上是朝着我们在这里移动的方向发展。

最好的方法是了解你工作的环境。 首先与开发人员和经理交谈。 试着让他们上船,并从他们的想法反弹。 他们很可能会对如何运行以及如何引入devops的想法会产生任何问题有一个好主意。

从那里开始看应用程序并逐一介绍它们来解决问题。

虽然这些工具和技术很重要,但关键途径是在整个组织中进行协作。 现在IT运营业务运营。 Etsy显示其仪表板上收入的变化,每个人都可以看到。