我在这里相当有帮助,希望有人能帮忙。
这是我有:戴尔R710与一个至强2.7 GHz处理器,18GB RAM,服务器2008年x64 SP2我运行与约5台服务器的HyperV。
从1月份开始,我遇到了崩溃的问题。
第一次它是一个虚拟机(Server 2003 SBS)。 它在事件日志中没有错误条目并且没有崩溃转储。 服务器自己回来了。
然后,上一周主机服务器(2008服务器)的两次崩溃,然后是大约一周后的今天。 同样,在事件日志中没有条目,没有崩溃转储,它自己再次出现。
我在一月初对服务器做了修改。 我更新了networking驱动程序(Broadcom)并添加了Teaming软件,并组合了两个接口。 我还将所有服务器上的Symantec Endpoint Protection升级到了最新的版本12.我也更换了交换机,但不把它作为问题的一部分。
我以为这是一个内存问题,因为一个虚拟机崩溃,以及主机。 但也可能是赛门铁克。
我没有崩溃DUMPS的全部,因为configuration服务器的白痴没有留下足够的空间在系统驱动器上复制DMP文件
这是DMP文件之一:
Microsoft (R) Windows Debugger Version 6.12.0002.633 AMD64 Copyright (c) Microsoft Corporation. All rights reserved. Loading Dump File [C:\Windows\Minidump\Mini012412-01.dmp] Mini Kernel Dump File: Only registers and stack trace are available Symbol search path is: SRV*e:\symbols*http://msdl.microsoft.com/download/symbols Executable search path is: Windows Server 2008/Windows Vista Kernel Version 6002 (Service Pack 2) MP (8 procs) Free x64 Product: Server, suite: TerminalServer SingleUserTS Built by: 6002.18484.amd64fre.vistasp2_gdr.110617-0336 Machine Name: Kernel base = 0xfffff800`01c1d000 PsLoadedModuleList = 0xfffff800`01de1dd0 Debug session time: Tue Jan 24 18:58:02.334 2012 (UTC - 5:00) System Uptime: 9 days 13:32:35.727 Loading Kernel Symbols ............................................................... ................................................................ ............................. Loading User Symbols Loading unloaded module list .................................................. ******************************************************************************* * * * Bugcheck Analysis * * * ******************************************************************************* Use !analyze -v to get detailed debugging information. BugCheck 7F, {8, 80050033, 6f8, fffff80001c70da4} Probably caused by : NETIO.SYS ( NETIO!MatchValues+14e ) Followup: MachineOwner ---------
我从此禁用了Teaming
这是另一个:
Windows Server 2008/Windows Vista Kernel Version 6002 (Service Pack 2) MP (8 procs) Free x64 Product: Server, suite: TerminalServer SingleUserTS Built by: 6002.18484.amd64fre.vistasp2_gdr.110617-0336 Machine Name: Kernel base = 0xfffff800`01c4b000 PsLoadedModuleList = 0xfffff800`01e0fdd0 Debug session time: Sat Jan 28 07:42:48.945 2012 (UTC - 5:00) System Uptime: 0 days 21:36:52.143 Loading Kernel Symbols ............................................................... ................................................................ ............................. Loading User Symbols Loading unloaded module list ........... ******************************************************************************* * * * Bugcheck Analysis * * * ******************************************************************************* Use !analyze -v to get detailed debugging information. BugCheck 7F, {8, 80050033, 6f8, fffff80001ceeaa2} Probably caused by : ntkrnlmp.exe ( nt!KiDoubleFaultAbort+b8 ) Followup: MachineOwner --------- 3: kd> !analyze -v ******************************************************************************* * * * Bugcheck Analysis * * * ******************************************************************************* UNEXPECTED_KERNEL_MODE_TRAP (7f) This means a trap occurred in kernel mode, and it's a trap of a kind that the kernel isn't allowed to have/catch (bound trap) or that is always instant death (double fault). The first number in the bugcheck params is the number of the trap (8 = double fault, etc) Consult an Intel x86 family manual to learn more about what these traps are. Here is a *portion* of those codes: If kv shows a taskGate use .tss on the part before the colon, then kv. Else if kv shows a trapframe use .trap on that value Else .trap on the appropriate frame will show where the trap was taken (on x86, this will be the ebp that goes with the procedure KiTrap) Endif kb will then show the corrected stack. Arguments: Arg1: 0000000000000008, EXCEPTION_DOUBLE_FAULT Arg2: 0000000080050033 Arg3: 00000000000006f8 Arg4: fffff80001ceeaa2 Debugging Details: ------------------ USER_LCID_STR: ENU OS_SKU: 7 BUGCHECK_STR: 0x7f_8 CUSTOMER_CRASH_COUNT: 1 DEFAULT_BUCKET_ID: DRIVER_FAULT_SERVER_MINIDUMP PROCESS_NAME: System CURRENT_IRQL: d LAST_CONTROL_TRANSFER: from fffff80001ca522e to fffff80001ca5490 STACK_TEXT: fffffa60`019e9a68 fffff800`01ca522e : 00000000`0000007f 00000000`00000008 00000000`80050033 00000000`000006f8 : nt!KeBugCheckEx fffffa60`019e9a70 fffff800`01ca3a78 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiBugCheckDispatch+0x6e fffffa60`019e9bb0 fffff800`01ceeaa2 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiDoubleFaultAbort+0xb8 fffffa60`005a8000 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!HvlEndSystemInterrupt+0x2 STACK_COMMAND: kb FOLLOWUP_IP: nt!KiDoubleFaultAbort+b8 fffff800`01ca3a78 90 nop SYMBOL_STACK_INDEX: 2 SYMBOL_NAME: nt!KiDoubleFaultAbort+b8 FOLLOWUP_NAME: MachineOwner MODULE_NAME: nt IMAGE_NAME: ntkrnlmp.exe DEBUG_FLR_IMAGE_TIMESTAMP: 4dfb5a33 FAILURE_BUCKET_ID: X64_0x7f_8_nt!KiDoubleFaultAbort+b8 BUCKET_ID: X64_0x7f_8_nt!KiDoubleFaultAbort+b8 Followup: MachineOwner ---------
希望我能在这里得到一些需要的指导。
谢谢
当涉及到BSOD,99%是一个驱动程序问题。
你可以改变configuration只存储一个内核转储,而不是一个完整的RAM,所以你可以保留更多。
我会做什么:
你有没有试过以下的修补程序? 我们有这样的一套R710不知道它现在是否已经包含在更新中了。
微软build议在使用Hyper-V时不要将NICS组织在一起。 我很高兴你把它关掉了。 我想这可能是问题所在。 如果你觉得这是一个内存问题,尝试拿出两个尴尬的RAM模块。 18GB似乎closures。 你应该至less有16GB。 我可能会从那里开始。