自从我们从OLD linux服务器迁移到新机器以来,我们一直被Server 2003“locking”。 看来,I / O每天都要等几次才能经过屋顶,每个人都会被挂起,直到操作系统能够清理干净。 总的来说,每个人都从新的服务器报告更好的响应能力,除非这个I / O积压堵塞了。
我们不确定如何解决它。 我们只有16个用户访问这台服务器,而且它的驱动器只有8GB空间(RAID 10,全部15K驱动器)。 磁盘/networking/内存/ CPU的性能计数器都接近于0,除了平均磁盘队列长度,在用户投诉的同时发生。
在Linux中,负载平均值永远不会超过2或3,而现在队列长度有时会达到10或12,尽pipe我们有更快的驱动器,更多的驱动器,更多的内存,更多的内核,相同的应用程序击中服务器等。
第一个问题 – 我们可以采取哪些措施来追踪和解决这个问题?
第二个问题 – 有没有办法在内存中创build一个逻辑磁盘驱动器(然后只是使用物理硬盘复制它,甚至写脚本从我们的应用程序复制它)? 整个数据驱动器只有8GB(而服务器支持48GB的内存),但我不知道如何处理这个。
听起来像驱动程序问题或硬件故障。 我会开始更新所有的存储和芯片组相关的驱动程序和硬件固件。
您也可以联系制造商的支持热线,询问他们是否看到过这种情况。 我知道这听起来很疯狂 ,有一半的时间他们有一个快速的解决scheme(或至less可以确定问题)。
如果您的存储arrays有pipe理程序,请检查错误或驱动器健康信息。 检查重新映射的扇区或其他指示灯显示驱动器有问题。
克里斯S已经给了你从哪里开始寻找伟大的指针。 Re:你的第二个问题,我不会build议你关心的生产数据的RAMDrives(甚至是DFS复制的)。
如果您的DFS复制是同步的,那么如果写入正在复制的物理驱动器以停止写入,则RAM驱动器可能会locking,如果您的复制scheme不同步,则将失去电源(而且UPS电池将会神秘死亡)物理副本处于不一致(或过时)状态:通过墨菲定律即时丢失数据。