Zimbra开放源码遇到不明原因的减速，只能通过重新启动解决

我们的zimbra服务器每隔几天都会遇到不明原因的延迟，只有在重新启动服务器后才能解决。从最终用户的angular度来看，如果他们使用networking邮件，并发送消息，那么最终会超时。从系统terminallogin，切换用户以及重新启动zimbra服务都会变慢。使用'su – '需要2分钟的时间来更改用户

重新启动所有的zimbra服务，dns服务，不能解决问题。问题只有在完全重新启动后才能解决。重新启动后，login，切换用户和重新启动服务器很快就会发生。

我们正在使用dnsmasq进行拆分DNS，这是因为NAT导致我们的环境所需要的。但是，查询DNS会立即返回结果。我们正在使用外部ldap数据库进行身份validation，但没有其他服务器使用它显示任何问题，也没有负载问题。其他一切都是默认的安装和configuration。

系统日志中没有明显的错误。服务器负载（磁盘IO）在发生问题和没有问题时是相同的。

最初这一般是在星期一或星期二每星期发生一次。本周发生在星期一和星期四。

我的版本是：

zimbra @ servername〜$ zmcontrol -v版本7.2.1_GA_2790.RHEL6_64_20120815212147 UNKNOWN_64 FOSS版本。

有没有人遇到或解决过这样的问题？

我发现rsyslog在通过TCP将日志转发到远程主机时，有时会在无法转发到远程主机时挂起。即使远程主机恢复运行，rsyslog仍然是挂起的，因此减慢了系统中所有尝试login的内容。重新启动rsyslog时会发生这种情况，但通过cron作业定期重新启动它似乎从来没有为我工作。我发现的最好的解决办法是没有远程主机太多了。 🙂

但是，可以对rsyslog进行调整，使其排队而不是locking。您可能仍会遇到此问题，在这种情况下，直到rsyslog重新启动才会转发日志，但不会影响整个系统。

注释掉你当前的转发规则，把它放在你的rsyslog.conf的末尾：

$WorkDirectory /var/spool/rsyslog # where to place spool files $MainMsgQueueFileName mainqueue # unique name prefix for spool files $MainMsgQueueMaxDiskSpace 2g # 1gb space limit (use as much as possible) $MainMsgQueueSaveOnShutdown on # save messages to disk on shutdown $MainMsgQueueType LinkedList # run asynchronously $MainMsgResumeRetryCount -1 # infinite retries if host is down *.* @@1.2.3.4:514 # replace this with your own forwarding rule

您将需要确保/ var / spool / rsyslog存在，因为否则将不会创build它。