我们的一个虚拟机崩溃了。 它不会回应ssh或ping。 由于几周前我已经崩溃了,我每10分钟logging一次top的输出,看是否有什么不妥的情况发生。 这是最后的输出: —————- 2017-07-06 06:40 —————- top – 06:40:01 up 9 days, 21:22, 0 users, load average: 0.05, 0.02, 0.00 Tasks: 165 total, 1 running, 164 sleeping, 0 stopped, 0 zombie %Cpu(s): 0.1 us, 0.0 sy, 0.0 ni, 99.8 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st KiB Mem: 16470612 total, 12609856 […]
我有一个BSOD。 这似乎与硬件有关。 在深入了解之后,我认为这是一个CPU问题。 我错了吗? Crash Code: WHEA_UNCORRECTABLE_ERROR (124) A fatal hardware error has occurred. Parameter 1 identifies the type of error source that reported the error. Parameter 2 holds the address of the WHEA_ERROR_RECORD structure that describes the error conditon. Arguments: Arg1: 0000000000000005, Generic Error Arg2: fffffa801364d028, Address of the WHEA_ERROR_RECORD structure. Arg3: 0000000000000000 Arg4: […]
我有一个VMWare ESXIpipe理程序,在过去的4-5个月里它一直工作正常,但突然之间,似乎是在负载下开始随机崩溃。 这个虚拟机pipe理程序上有两个VM,一个是Ubuntu Server和Windows Server 2008 Windows Server 2008只运行一个VPN,很lesslogin。 Ubuntu运行一个Nginx Web服务器MySql服务器2个Agar服务器和1个Minecraft服务器。 最近启动Minecraft服务器3-8小时后,整个机器重新启动。 采用英特尔i7 CPU四核3.4 GHz的水冷和空气冷却。 我可能怀疑ESXI的启动驱动器可能已满,会导致重启,如? 任何想法可能会导致这个问题? 垂死的CPU电源过热? 无论如何要缩小这个原因吗? 任何帮助将不胜感激!
去年五月份我为客户build立了一个英特尔服务器。 我一直没有问题地build立这些。 服务器2012R2标准,英特尔S1200SP主板和P4304XXSFCN机箱,RMS3CC080 +电池,RAID10,16GB内存,DC,文件pipe理,Essentialsangular色。 每3周到1个月,服务器将停止响应所有input。 你仍然可以在本地看到屏幕,但不能做任何事情。 球迷们进入高位,你必须重新设置才能恢复。 除了关于不洁的关机之外,事件日志中没有任何事情发生。 没有在bluescreenview。 RAID日志很干净。 我已经在保修范围内更换了RAM,只是为了排除这个问题,即使通过了testing。 我的下一步是放弃一个新的主板,但这是相当数量的劳动和重新设置。 有没有人知道有什么工具可以揭示发生了什么? 我完全失去了。 我有几个其他的服务器在同一个configuration和零问题,这使我倾向于主板领域。
我已经运行Ubuntu服务器14.04约两年。 但几个星期后,服务器崩溃和烧伤每一天。 我不清楚为什么会发生这种情况。 我检查了/var/log日志文件,但是这些文件没有提供任何关于服务器为什么或者甚至是closures的信息。 是否有结构化的方法来解决这些崩溃? 我能否以某种方式/某处增加login? 这是否意味着没有任何信息表明某种问题? 这种types的崩溃类似于只是closures电源可能?
最近,我们用我们的oVirt 4.1三节点集群与HE和GlusterFS(RF = 3)存储域发生了一场灾难。 我们已经将一个节点移动到维护,并且在实际维护期间,一个具有SPMangular色的工作节点出现故障。 这是硬件故障,所以我们不得不从集群中删除它。 经过现在的修改之后,我们几乎有两个节点的工作簇,GlusterFS RF = 2。 但问题是oVirt无法find与“HSMGetAllTasksStatusesVDS失败:不是SPM”错误的SPM和Spam Web界面日志。 经过一段时间的操作,我们丢失了dom_md的内容。 看起来这两个问题是相关的,第二个是第一个的结果。 请build议如何恢复SPM和dom_md。 有没有办法重新创build两个? TIA 问候,亚历克斯
互联网说这是一个真正的内核错误,但没有人知道是什么触发? 运行内核2.6.27.24的CentOS x86_64的服务器 这是我的崩溃输出: [root@u15345757 httpdocs]# Message from syslogd@ at Thu Aug 6 01:42:22 2009 … u15345757 kernel: [1145736.506380] Eeek! page_mapcount(page) went negative! (-1) Message from syslogd@ at Thu Aug 6 01:42:22 2009 … u15345757 kernel: [1145736.517515] page pfn = d0a3 Message from syslogd@ at Thu Aug 6 01:42:22 2009 … u15345757 kernel: [1145736.523814] page->flags […]
我们有一个Windows 2003 Server,经常崩溃(大约每周一次)。 在服务器崩溃时,事件日志中没有任何信息。 不在应用程序中,不在安全中,而不在系统中。 监控系统(Nagios)在发生故障时不会报告机器上的任何exception情况。 而当我说崩溃,我的意思是服务器closures,而不仅仅是一个蓝屏。 我已经对撞车的原因作了一些猜测,但迄今为止没有任何事实certificate是正确的。 有谁知道我在哪里可以find进一步的信息(如日志)或提供任何有用的猜测原因?
我是一个软件家伙。 我inheritance了一个Windows 2008服务器,它有一个4磁盘RAID机箱(来自NewEgg的Rosewill机箱之一)通过eSata连接到它。 Windows服务器使用其本机软件raidconfigurationpipe理工具来维护raid。 服务器崩溃了。 是否有可能采取突袭机柜,因为它坐着插入到另一个Windows机器,检查或重buildarrays,如果需要或是没有原来的系统的RAID基本上死了?
我现在有点困惑,最近我的朋友谁也照顾了服务器从DirectAdmin得到一封电子邮件说,我们得到了一个来自意大利知识产权的暴力攻击,但我没有机会看看碎石。 我们的Virtualbox在Xserver上运行,现在每当我的服务器崩溃的时候,是因为它崩溃,所以我不知道是否因为我们的服务器得到暴力攻击? 我的朋友告诉我,这可能是来自其他网站的黑客试图让我们的网站。 我如何检查日志或防止这种情况继续发生? 我们正在运行CentOS 5 谢谢