Articles of 服务器崩溃

内存和交换已满,不能ssh; 除物理重启之外的任何选项?

错误地,我执行了一些应用程序,使用所有的内存(我认为交换)在我的Ubuntu服务器,现在崩溃,SSH不工作,冻结。 除了以下解决scheme之外,还有其他的select吗? 物理重启服务器。 等到一个过程结束。 有什么办法远程重新启动服务器时,SSH不工作? 我仍然可以ping服务器,所以想知道是否有任何保留的内存用于杀死不友好的进程或基本命令,如重新启动Os。 *使用“nohup”执行的命令,所以他们没有通过closuresssh会话结束。

MySql Data Loss – 验尸分析 – RackSpace Cloud Server

经过RS云服务器最近的“紧急迁移”之后,我们的服务器快照映像上的mysql数据库被certificate是从备份date过期的日子。 然而,通过受影响的webapp上传的文件已被写入文件系统。 写入数据库的相关元数据丢失,但文件本身已备份。 一旦我能够在mysql服务器启动之前手动访问mysql数据文件(服务器被configuration为在启动时启动mysql),我可以看到ib_logfile1,ib_logfile0和ibdata1的更新时间已经过去了几天。 就像这张海报一样, 服务器崩溃后mysql数据丢失 ,就好像一些caching控制器已经告诉OS / mysql服务器它已经提交了仍在caching中的数据,并且丢失了而不是刷新了。 我不能很好地包装上传的文件如何写入,但数据库数据没有。 我原以为任何caching都会刷新整个系统,而不是逐个进程。 有关这可能发生的任何build议? 更新二: 看到我的答案下面解释发生了什么事。 更新: 根据要求configuration详细信息。 RackSpace云服务器详细信息: 操作系统:Ubuntu 10.04 LTS(Lucid) 内存:1024 MB 磁盘空间:40 GB 数据中心:ORD1 服务级别:不受pipe理 root @ restore-testing:〜#dpkg -s mysql-server … build筑:所有 资料来源:mysql-dfsg-5.1 版本:5.1.61-0ubuntu0.10.04.1 … root @ restore-testing:〜#cat / etc / fstab proc / proc proc defaults 0 0 / dev / xvda1 / […]

磁盘空间可能是服务器崩溃的原因吗?

查看MySQL错误文件后,我发现有关磁盘空间的错误。 现在我想它是MySQL崩溃的原因: [root@xxxx ~]# cat /var/lib/mysql/xxxx.com.err 120528 17:45:05 [Note] Crash recovery finished. /usr/sbin/mysqld: Disk is full writing './mysql-bin.~rec~' (Errcode: 28). Waiting for someone to free space… (Expect up to 60 secs delay for server to continue after freeing disk space) 这可能是坠毁背后的原因吗?

硬体看门狗已经在我的CentOS服务器上启动了吗?

我用一个低成本托pipe服务租用了一个专用服务器 (与Intel Haswell CPU和定制硬件),并将其与CentOS 6.4 / 64位Linux(库存内核:2.6.32-358.14.1.el6.x86_64)一起使用。 每隔几个星期它就会挂起,其他客户似乎也有类似的问题。 在我看到的dmesg输出(这里是完整的dmesg输出 ): CPU0: Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz stepping 03 …. NMI watchdog enabled, takes one hw-pmu counter. …. iTCO_wdt: Intel TCO WatchDog Timer Driver v1.07rh iTCO_wdt: Found a Lynx Point TCO device (Version=2, TCOBASE=0x1860) iTCO_wdt: initialized. heartbeat=30 sec (nowayout=0) 并在stream程列表中看到: # ps uawwwx|grep [w]atchdog root […]

从Windows 2008 R2 SP1分析BSOD转储文件

我在使用VMWare运行的虚拟Windows Server 2008 R2 SP1服务器时遇到问题。 服务器正在运行Citrix,并且还安装了Symantec Endpoint Protection。 它随机崩溃,并去BSOD。 调查事件日志没有提供任何有关坠机原因的有用信息。 我运行windowsdebugging并生成如下所示的报告。 显然它指向一个失败的驱动程序。 问题是我无法确定驱动程序是由什么造成的。 我想知道是否有人可以提供一些帮助。 ———- ## Bugcheck Analysis ## SYSTEM_SERVICE_EXCEPTION (3b) An exception happened while executing a system service routine. Arguments: Arg1: 00000000c0000005, Exception code that caused the bugcheck Arg2: fffff9600008744d, Address of the instruction which caused the bugcheck Arg3: fffff88007ba3de0, Address of the context […]

MCE错误代码/粉红色屏幕 – 是否应该引起关注?

所以我最近购买了服务器级系统以及所有服务器级的外设。 我获得了ESXi 6的许可,并且安装了所有最新的修补程序。 系统已经运行了两周左右,突然之间我彻底崩溃了。 我把这个错误代码解释为“内部定时器错误”。 我已经将信息转发给SuperMicro,但说实话,我现在对他们的回应并不是很有信心。 我的解释是,系统不应该崩溃 – 因为它是一个至强运行ESXi的ECC内存的Xeon。 这有可能是一个错误,不应该再发生? 你将如何处理? 寻找来自那些看到这些types的错误,他们最终实际做了什么的一些build议。

ESXi v5.5发生随机崩溃

硬件:types:HP Proliant ML350 G5内存22GB CPU 1个英特尔氙E5405 2.00GHz OP:ESXi 5.5刚刚从5.1更新,尝试修复ESXi 5.1在相同硬件上发生的崩溃。 我试图find为什么我们的服务器崩溃的错误,现在已经有两个locking在24小时。 前面的内部错误指示灯呈红色闪烁,只有“#5和#6页面76”手册中的“处理器2”指示灯“琥珀色”和“电源”指示灯“绿色”闪烁。 在日志中,我可以在相关的时间框架中看到的唯一错误是在日志之下。 这是原因吗? 或者还有什么我可以做的尝试和logging/find错误。 来自zcat syslog.6.gz | 减 2014-05-26T11:55:47Z sfcbd[35064]: Error opening socket pair for getProviderContext: Too many open files 2014-05-26T11:55:47Z sfcbd[35064]: Failed to set recv timeout (30) for socket -1. Errno = 9 2014-05-26T11:55:47Z sfcbd[35064]: Failed to set timeout for local socket (eg […]

为什么Linux kdump不能写入/ var / crash?

这又发生了! 我有4个定期崩溃的服务器,并且没有信息打印到系统日志或串行控制台。 此外,Linux kdump服务不会将核心转储写入/var/crash的默认位置。 你能帮我弄清楚为什么? 如果我的根文件系统是LVM卷,这有什么关系吗? 这是我试过的。 我的系统是具有最新内核的Scientific Linux 6.5。 [root@host1 ~]# uname -r 2.6.32-431.11.2.el6.x86_64 [root@host1 ~]# cat /etc/issue Scientific Linux release 6.5 (Carbon) 文件/etc/kdump.conf是包含默认设置的vanilla文件。 大多数行被注释掉, path和core_collector只有两条活动行。 #net my.server.com:/export/tmp #net [email protected] path /var/crash core_collector makedumpfile -c –message-level 1 -d 31 #core_collector scp 我确保kdump服务正在运行,并且kdump不需要重build我的initrd 。 [root@host1 ~]# chkconfig –list kdump kdump 0:off 1:off 2:off 3:on 4:on […]

什么会导致服务器上的所有服务closures,但仍然响应ping? 以及如何弄清楚

在几天之内,我已经发生了两次,我的服务器完全closures,这意味着http,ssh,ftp,dns,smtp,基本上所有的服务都停止响应,就好像服务器已经closures,除非它仍然响应ping ,这是最让我吃惊的。 我确实有一些PHP脚本在服务器上造成巨大的负载(cpu和内存),只有一小部分用户使用,但通常这些服务器在这些连接上“很好地存活”,当它下降时从不与用法上的高峰相吻合(我不是说它不能相关,而是在那之后不会发生)。 我不是要求你神奇地告诉我这些崩溃的最终原因,我的问题是:是否有一个单一的过程,其死亡可能导致所有这些服务同时下降? 有趣的是,除了ping,所有的networking服务都closures了。 如果服务器有100%的CPU被某个进程吃掉,它也不会响应ping。 如果apache因为(例如)一个破坏的PHP脚本而崩溃,那只会影响http,而不是ssh和dns ….等等。 我的操作系统是Cent OS 5.6 最重要的是,在重新启动服务器之后,我应该查看哪些系统日志? / var / log / messages不会显示任何可疑内容。

戴尔PowerEdge服务器死机,如何修复? 发生了什么? 里面的信息

我目前正在上高中,运行我们学校的网站。 今年夏天,我们的系统pipe理员被诊断为癌症,他去了治疗,所以我已经陷入了一个有趣的情况。 我真的不确定这个networking服务器有什么问题,但是我想为你的想法/教学/input而努力,因为我正在努力学习,以便我能够帮助你。 服务器运行/正在运行FreeBSD,这可能意味着什么,因为这是一个硬件问题。 我知道服务器有五个相同的驱动器(这是否意味着Raid-5?),但在崩溃时,有三个工作驱动器(“运行在降级模式?”)。 大约一个星期前,服务器不能启动,因为它只能find1个逻辑驱动器。 我运行configuration工具,看到这个: 我认为在这个活动中还会留下一些数据,对吧? (我有备份的网站,只是不是实际的操作系统和Web服务器设置)。 如果有任何我需要添加的信息,以便更好地解释发生在我身上的事情,我非常愿意这样做。 我只是想知道发生了什么事情,这是什么,以及如何采取措施来解决这个问题。 非常感谢。