您需要在Linux服务器上执行的常规维护是什么?

我有一个服务器,主办几个网站,除了查看几个日志和压缩他们,我没有做约2个月的任何维护

只是想知道你需要在你的Linux服务器上执行什么样的定期维护? 有任何脚本可以让你进行维护吗?

最重要的是保持服务器的监控,以便您随时了解服务器上正在发生的事情。 跟踪磁盘使用情况,CPU使用情况,负载情况,内存使用情况,stream量情况等都很重要。有许多开源工具可以帮助您完成此任务。 这也有助于您规划未来的升级。

另一方面,您需要执行定期和自动备份,并且偶尔testing备份非常重要,以确保其正常工作。

检查更新,尤其是安全更新也很重要,并在需要时进行安装。

所有可以自动完成的方式都应该以自动的方式完成,但是不要忘了稍后检查日志。

希望这可以帮助!

这里有两个有用的工具类:

  1. 像Nagios这样的监控工具可以让您跟踪使用情况和其他统计数据。
  2. 像Puppet和Chef这样的configurationpipe理工具可以让你对系统的预期状态(它应该安装什么软件包,文件的内容应该是什么等)作出说明,然后定期运行以确保系统的符合性。

修补您的操作系统,以获得最新的错误修复和安全更新。 这是你可以采取的最重要的一步。 除此之外,你需要有适当的监控来告诉你随着时间的推移你系统的状态。 我不同意上面的观点,监控不是维护。 您需要对系统有一个基本的了解,以及它如何运行以查看什么时候不工作或需要维护。 真正做到这一点的唯一方法是绘制一切。 我们使用Nagios,仙人掌和神经节的组合。

至于脚本,你提到压缩日志,所以看看logrotate。 还有日志。

以前对这个问题的回答都是值得回答的,但它们都是大规模思考的。 如果你只有一个主机,提供网站的故障不会立即杀死小猫,你可能会想稍微小一点。 我会build议如下:

使用logwatch或类似的系统来聚合你的日志并邮寄给你一个总结。 至less每隔一天阅读摘要。 使用一个工具,将您的博客(例如模拟)揉成一个可读的摘要。 如果您想要更加雄心勃勃,请使用云服务来监控您的网站。

然而,系统维护的本质仍然是一样的: 杀死每一个发生死亡的问题,使它永远不会再发生 。 这是重要的一点,因为这意味着不应该有“定期”维护。

现在更大的规模:

当你扩大规模时,你遇到的第一个问题就是某些事情会中断,而你却不知道。 这绝不能再发生。 然后你得到一个全面的监控解决scheme。 另外,在一台主机上看到了这个问题,你想阻止它发生在任何其他主机上。 那是当你获得一个configurationpipe理系统的时候。

但是你现在一定不要自满。 所有的努力应该进入永久的解决scheme。

维护工作由监测完成。 如果你有一台机器暴露在外面的访问,你必须有一些检查工具:rkhunter,chkrootkit是每天发送邮件的基础知识.. smartd必须检查硬盘和发送邮件,以防万一出现错误,tripwire的完整性检查,助手IDS +的完整性检查,以及其他许多..当然,这是假设系统已经硬化(至less在默认的SElinux目标政策),将是伟大的做与nagios,zabbix和其他..(继续注意机器的普通事件和状态)

马科斯做了一个很好的恢复共同点维护:监测,备份和更新。

我需要重复(通过人们的意见)监测!=维护。

我想补充一点:旧用户清理 ,旧cron任务等密码续订。 系统configuration的演变 (查看监控历史)(包括监控和备份的发展)与服务器的生命变化。 安全审计 。 定制报告(即服务的详细使用,共享资源,安全报告)。 和…

随机恢复备份(无需执行)。 如果您不使用自动部署系统来恢复整个服务器,也总是包含MBR(主引导logging)的副本。

我已经看到防火墙可以在500天的正常运行时间内存活(是的,这是一个糟糕的维护,因为每年大约有10/15次内核升级,所以正常运行时间相当于易受攻击的内核 ),而无需人工维护。 这只是分区,系统日志上的一个很好的configuration,并且没有重大的configuration更改。

你问脚本 。 也许有一些通用的预包装脚本,但更多的是DIY (自己动手做)。 所以,首先你要学习或者阅读你的系统是如何工作的 (这包括发行版特定的REAME,手册页,策略和编译选项), 然后 考虑你的系统应该如何工作然后 编写自定义脚本(cron,自定义命令等)pipe理OS +期望的行为/结果/报告/变更pipe理/回滚/反应/等的组合。

另外,可用的通用工具 (monit,nagios,cacti,zabbix等)可以使用脚本技能和可用的第三方插件进行扩展

例如:你是否只需要知道“如果分区已满”,或者你是否也需要控制磁盘温度,空闲inode,文件和文件夹权限,校验和,SMART状态,坏扇区,文件系统检查以及估计的生命周期物理硬件?

除了备份之外,监控系统和定制应在可能的情况下进行validation,模拟故障,攻击等。

在预生产服务器,环境,目录,数据库等环境中,自定义脚本可以更好地进行validation和清除错误。