Windows 2003存储服务器挂在大文件传输上

在我们的一个办公室里,我们有一台戴尔PowerVault 745N NAS设备作为主要的文件服务器。 其运行32位Windows 2003存储服务器SP2与3GB内存。 服务器拥有大约60个用户HOME文件夹,通过AD映射。

办公室客户端是XP SP3,Vista和Windows 7的混合。偶尔服务器将在传输大文件时完全挂起。 当挂起发生时,控制台变得没有反应,只有鼠标活动和空白的壁纸。 有时停止拷贝会释放服务器,有时候不会。

悬挂可以持续20分钟左右。 在此期间,其他服务器也无法在控制台上显示空白墙纸。 如果您设法进入另一台服务器,则任务栏和运行命令无响应。

这也有时会超出客户端计算机的资源pipe理器崩溃。 我猜这是由于HOME文件夹映射。

最终NAS服务器释放,一切都将恢复正常。

服务器configuration如下:

PERC 4 / DC DATA 2 – 12 SCSI HDD – RAID5

SHADOWCOPY 2 SCSI HDD – RAID1

CERC SATA DATA 11 4 SATA硬盘 – RAID5

OS 4 SATA硬盘 – RAID5

所有的驱动程序和固件是最新的。 我已经通过了戴尔的所有诊断,硬件已经清理完毕,包括对arrays进行全面的HDDtesting。 服务器已经安装了NOD32作为AV,但挂起发生在卸载时。

发生这种情况时,事件日志中没有任何错误,我们的任何ProCurve交换机上都没有任何错误logging。 域名上的DNS很好,AD可以告诉我的是快乐的运行。

没有DFS或NFS共享设置。 所有的份额都是标准的Windows。

我没有选中允许计算机closures此设备以节省网卡上的电源pipe理下的电源盒。

“设置链接速度和双工自动协商1000”增加接收描述符缓冲区从256到352(保留更多的CPU资源来处理数据)

我已经使用networking监视器运行networking跟踪,并发现以下内容:417 8.078125 {SMB:192,NbtSS:25,TCP:24,IPv4:23} 192.168.2.244 192.168.5.35 SMB SMB:R; Nt创buildAndx – NT状态:系统 – 错误,代码=(52)STATUS_OBJECT_NAME_NOT_FOUND

我尝试了不同的布线。 网卡和交换机端口都具有相同的结果。 从域上的其他服务器传输文件是好的。 我没有做的是在驱动器上运行CHKDSK来查找任何文件系统错误。

在Vista客户端上,我也运行netsh接口tcp设置全局autotuning =禁用没有结果。

难道是服务器有一个错误的驱动器或I / O太多,它处理?

任何想法为什么会挂起与LAN上的其他服务器的问题?

非常感谢。

您是否在复制这些大文件时观看了服务器的内存使用情况? 就我个人而言,我发现移动一个10GB的文件是一个伟大的方式来激怒我的Windows 2003服务器…看看这个话题: Windows Server 2008 x64,大文件传输和内存使用情况

讨论了一些用于处理大文件的替代文件复制工具。 我已经与RichCopy祝好运。

这听起来像服务器的副本超过了磁盘子系统的写入function(或其中的一部分)。 PERC控制器上的12xSCSI Raid 5组应该能够以> 200Megabytes / sec的速度支持大量的顺序写入(希望有更多),但是CERC上的SATA组可能要挣得70Mg / sec甚至更多比那慢。 针对SATA Data Raid包的大型副本可以很容易地通过GigE连接进入,如果发生这种情况,那么Windows 2003将占用本地尽可能多的服务器本地内存,因为它需要缓冲副本。 缓冲区的增长将牺牲服务器上的所有其他内容,甚至会导致核心操作系统服务页面出现,从而导致您报告的完全locking行为。 如果是这种情况,那么将大副本活动的目标位置移动到PERC RAID组应该有所帮助。

这应该是一个非常本地化的问题(即只影响这台服务器),如果你在一个健康的交换networking上,但是如果其他服务器依赖于该服务器托pipe的共享或服务,那么它们也可能会出现一些问题。 这就是说你所描述的症状暗示了比这更严重的事情。 如果您在其中一个事件期间物理login到其中一台服务器,您是否看到相同的问题?

由于将交换机端口与NIC速度匹配,因此服务器上的结果更好。 我也closures了NOD32上的AMON模块,因为我注意到当传输发生时,有时AV似乎挂在文件上一段时间。 我在服务器上运行2.7,因为我在大多数服务器上遇到了V4的严重问题。

服务器仍然不是100%,但我似乎没有经历任何长时间挂起了。 另外服务器的内存似乎不是问题的原因。

当问题发生时,您遇到问题,因为login到第二个服务器将尝试从NAS服务器加载configuration文件?

大文件有多大? 每次都locking服务器吗? 你可以testing两个工作站之间的大型文件副本,并看到它能正常工作,同时在两台(或另一台服务器)上运行AV。

我知道有人已经指出上面看Windows内存使用情况….

我会看网卡驱动程序,你已经说过驱动程序是最新的,在这种情况下,我会寻找一个较旧的驱动程序,或closures网卡的TCP卸载选项。 我不得不与MS一起工作,以解决Windows群集networking问题,在排除故障时closuresnetworking卸载是非常好的。

HTH,Mark