微软交换维护计划每天晚上杀死服务器

我相信我有一个服务器有错误的硬件。 我认为这是主板,因为我已经testing了内存,但无论如何,我会解释发生了什么。

我的交换服务器有1个私人商店(13GB),1个公共商店(8GB)Raid5,交换商店在一个单独的分区,总大小38GB,大约10GB的可用空间。 这是一个32位操作系统(赢得2003年服务器标准),与4GB的内存。 它有2个E540 @ 2.50GHz的处理器

每晚上午1点到5点,Exchange对其交换店进行在线维护。 问题是,每天晚上,当这些维护程序之一正在执行时,服务器冻结/locking。 当我开始工作并检查服务器时,服务器不响应,屏幕仅locking在卡住的屏幕保护程序上。

我只知道为什么它冻结,因为我在凌晨1点login,看着taskmgr,看到一个特定的进程咀嚼了很多内存,然后突然间,我失去了连接到服务器。 原来是交换。

所以我的问题是:在这个维护期间做什么交换? 我认为这基本上只是一个碎片整理。 如果是这样的话,我可能需要将交换数据库移动到另一台计算机上,并且每个月执行一次离线碎片整理。

如果你给这台服务器一个巨大的任务做…涉及大量的内存..它冻结。 惠普认为在远程testing之后不会有任何问题,也不希望与之有任何关系。 我很愤怒。

任何想法或build议将不胜感激。

联机碎片整理过程既是内存又是磁盘IO密集型。 这不是特别的CPU密集型。 在压力方面,我猜测I / O子系统比内存更难。 也就是说,你自己的testing表明,大内存进程会导致硬锁。 Windows中的硬锁通常是某种types的非常低级的错误,这在某种程度上build议硬件。 它可能不完全是内存,也可能是内存插槽,芯片组中的一些热量故障(在惠普服务器中不太可能,但可能发生),甚至是CPU。

这些很难分离,特别是因为它似乎与负载有关。 主板不是一个错误的诊断。

我不会倾向于指向Exchange – 所描述的服务器对于运行Exchange 2003的工作已经足够了。为了便于比较,我们有一个类似规范的Exchange 2003服务器,邮箱存储区是超过10倍,我们在在线碎片整理过程中没有问题。

维护期间的任务logging在这个Microsoft KB中 (碎片整理是最耗费资源的)。 既然你说任何 “沉重的”工作都会使服务器瘫痪,而不仅仅是Exchange维护期,我还会指责一些错误的硬件。

我不build议每月(或任何真正的)的邮箱存储脱机磁盘碎片整理,它只会惹恼人。 必须卸下该商店的脱机碎片整理(因此在此期间没有电子邮件),这将需要很长时间。