如何诊断非常糟糕和缓慢的ext3行为?

我正在pipe理一个运行Redhat WS4 update 3的旧pipe理服务器,而且我们有一个ext3卷,在/ opt上安装了一个大的(30GB)sqlite数据库。

每次我在这个数据库中进行大量的查询/插入操作,都会引起IO等待,以至于我们无法再login到服务器,也不能向其他用户申请,也不能编辑crontab文件(vi永不退出)。

我正在用mysqlreplacesqlite,同时备份19GB或mysql目录,我遇到了同样的问题。

请注意,这些操作是由普通用户完成的。 服务器是64位内核2.6.9-34.ELsmp的PROLIANT DL385 G1。

我现在考虑重新安装卷作为ext2来看日志是否是我的问题的来源,但我真的不知道接下来要检查什么。

每一个严重的文件副本最终都会阻止其他用户尝试login的服务器,一旦复制结束,服务器恢复正常。

我需要指向下一步看什么来解释这种行为(旧磁盘变慢?坏的内核与已知的错误?腐败的日志触发成千上万的多余的读/写?等等)

提前致谢。

回答我自己的问题,因为我终于find了问题的真正根源。

1_ syslog.conf被configuration为login文件并立即刷新我们的代理(最近configuration为使用此服务器syslog来loggingLDAP身份validation尝试)。 由于愚蠢的(或错误configuration的)更新程序,a-la Adob​​e更新程序会以每秒几次的速度发生。

毫无疑问,服务器是CONSTANTLY冲洗缓冲区到磁盘,并显示每次我们试图写入大文件。