我有一个服务器,每隔几天内核恐慌。
mcelog告诉我:
Hardware event. This is not a software error. MCE 0 CPU 6 BANK 8 MISC 0 TIME 1317928482 Thu Oct 6 15:14:42 2011 MCG status: MCi status: Error overflow Uncorrected error MCi_MISC register valid Processor context corrupt MCA: MEMORY CONTROLLER AC_CHANNEL0_ERR Transaction: Address/Command error Memory address parity error Memory corrected error count (CORE_ERR_CNT): 21763 Memory transaction Tracker ID (RTId): 0 Memory DIMM ID of error: 0 Memory channel ID of error: 0 Memory ECC syndrome: 0 STATUS ea1540c0008000b0 MCGSTATUS 0 MCGCAP 1c09 APICID 20 SOCKETID 1 CPUID Vendor Intel Family 6 Model 44
我要去尝试BIOS更新。 之后,我不知道接下来要做什么。 禁用第二个CPU可能会让我现在继续运行。
如果这真的是一个CPU错误,它可以打破某种程度。
您可以先尝试英特尔微码更新。
这看起来像一个主板内存控制器错误,所以我会期待更换主板。 searchMEMORY CONTROLLER AC_CHANNEL0_ERR可以让你获得这个以及其他类似的参考。