我在syslog中收到这样的消息。
rsyslogd-2177: imuxsock lost 21869 messages from pid 3418 due to rate-limiting rsyslogd-2177: imuxsock begins to drop messages from pid 3427 due to rate-limiting
我的服务器在过去几天变得没有反应,我必须重新启动机器2-3次。
请让我知道这些消息可能是什么,如果这些消息可能是服务器closures的原因。
就在几秒钟前,我解决了一个问题,一个简单的进程挂在繁忙的cpu循环中,像锁或互斥体。 Syslog显示了这些消息:
Jan 9 12:15:43 host1 rsyslogd-2177: imuxsock lost 354 messages from pid 157711 due to rate-limiting
和进程157711是后缀。 service postfix restart立即解决了这个问题。
我的经验是,在有问题的日志消息丢失几天后,日志中可能会出现消息“rsyslogd-2177:imuxsock由于限速而丢失了来自pid yyy的xxx消息”。 这意味着你不能在当前的日志文件中find给定的pid的任何其他引用,所以不能从该pid中find任何可能告诉你它是什么的消息。
假设你正在使用类似logrotate的东西,那么通过前一周的存档日志来查看可能会显示丢弃的消息的来源,并且你会看到启动洪水的消息,这可能足以理解正在发生的事情。
这听起来像你可能有一个失控的进程在你的系统上运行…也许,即使你的机器可能已经被攻陷了(?)。
这些日志消息与rsyslog的速率限制function相关 。 我目前正试图在我的一台机器上找出类似的问题,尽pipe我的情况似乎不那么严重 – 我一次只能丢失大约100条日志消息。 (例如,我看到“imuxsock失去了100条消息…”)
如果任何人有任何关于追踪“丢失”logging的消息来源的见解,这可能是最有帮助的。 我相信我的问题可能与Postfix有关,但是由于日志消息中给出的进程ID(“pid”号)不再相关(可能这些进程已不存在),所以有点棘手。 ..
我有类似的问题,这可能是由于cronjob失败,并试图发送邮件。 这封邮件被终止,后缀不喜欢它。