“维修站点”维修工作是什么样的?

我是一个温和的Web开发人员。 我没有pipe理任何高stream量的网站。 一般来说,我发现只有高stream量的网站才会维护。 stackoverflow.com也将下降维护。

我总是怀疑。 他们做什么样的维护? 我的意思是,这个过程是自动的。

用户请求 – > Web服务器 – >服务器端程序—>数据库服务器。

有什么要维护?

通常最高的stream量网站不会因维护停机。 他们的devise,所以他们不必。 (根据网站的情况,这可能非常棘手,这不仅仅是运行多个服务器的情况,尽pipe显然这是一个起点。)

但是,通常“维护站点”是指以下任何一项:

  • Web应用程序软件升级(添加新function等)
  • 硬件改变(例如移动到不同的数据中心;在切换期间)
  • 有些事情发生了严重的错误,他们正试图解决这个问题(例如,在数据中心发生停电事件;将DNS条目更改为指向静态“站点已closures”页面,直到电源恢复为止)

他们可能希望在服务器上运行的许多不同软件上运行更新(或修复),包括(但不限于):

  • 操作系统
  • webserver软件iteself
  • 任何脚本框架
  • 数据库
  • 等等

除此之外,他们还可以进行硬件维护,例如添加新的硬盘,升级主板,加载更快的RAM或更换网卡。 有很多东西,硬件和软件,可以升级或修改,真的。

现在,如果他们有一个备份服务器(或一个集群或类似的东西),这可以是透明的,但如果它真的是一个盒子服务的页面…好吧,它几乎不得不下降。

既然你是从一个编码背景来的,我将以我的类比为基础。 想象一下,作为一个系统pipe理员就像编程一样,除非你每隔几个小时就会被调用一种不同的语言。 有时候是帕斯卡。

确实,这可能意味着什么。 有时候老鼠会嚼到一个温暖的地方。 或者一个单一的失败点使自己知道。 消除停机是我们追求的目标…就像编写能够在第一次编译时完美工作的代码一样。

将一台服务器与一辆正在运行的车辆进行比较 如果你关掉车辆,你的“服务器”就closures了。

在汽车运行时,您可以做一些事情 – 添加燃油,机油,清洗液,清洁挡风玻璃,更换齿轮等。

但是,在运行时,不能更换汽车中的燃油pipe – 将燃油比作数据; 你不想失去任何东西,否则你会有不愉快的客户。

这些停机时间根据pipe理员技能水平和变化的复杂程度而有所不同。 在较大的高stream量站点上 – 这种可能发生的唯一方式是,如果有一个重大的架构变化, 无论您有多less服务器和冗余,架构都需要一次性更改。

对于非常大的系统来说,这是罕见的 – 我把它比作替代正在运行的车辆上的燃料pipe线:对于许多人来说,在某些技能和资源水平上做(或值得努力/冒险)是不可行的。 但是,对于拥有技能和资源的地方,他们可以对正在运行的车辆执行燃油pipe路更换。 比如说build筑移民; 他们做得更复杂。

可能是服务器,框架,数据库的升级移动到新的数据中心并closures旧服务器,以便任何人都无法连接修补在这些服务器上运行的操作系统或软件

基本上任何可能使网站在一定时间内不可用的任何东西

定期维护项目包括重buildcaching,升级软件和/或模板,进行一些数据拖网统计,诸如备份等各种日常维护任务(在安静的系统上更好地工作)以及各种其他昂贵且不经常的任务。

有些任务只需要大量的数据,而且每次更改后都不是很有效。 build议数据库是一个可以想到的事情,因为您不需要第二个数据,而且计算跨越许多不同用户的常见采购模式相当昂贵。 这是一些algorithm的N ^ 2复杂度问题,往往需要大量的数据拖网和大量的内存。

金融机构可以利用停机时间来计算利息支出,或者结清未完成的交易,计算和解余额。 这个数据在理论上应该不会在和解之后改变,所以在这一点上写入WORM存储是有意义的。

备份是停机期间经常完成的一个主要项目,因为高磁盘I / O往往会将非常强大的服务器带到他们的膝盖上,并且使站点脱机可以帮助加速备份过程。 我记得有一家公司,他们有一个非常大的客户RAIDarrays,备份团队一直在抱怨,因为他们的这个客户的备份窗口通常延长了22-24,并且一点26小时。 less量的安静时间可以大大减less这个窗口。

整理磁盘arrays。 它更快速,更安全地在离线时对服务器进行碎片整理,从而使CPU和磁盘专注于该任务,而不是运行1000个网站。 最好告诉人们晚点回来,而不是给他们糟糕的用户体验。

如果它是一个Windows服务器,则可以通过在内存使用率超过50%的情况下运行碎片整理来使其崩溃。 这是因为在这一点上,Windows开始加速页面文件。 我经过惨痛的教训才学到这个。