Articles of 服务器崩溃

我的服务器突然崩溃,每2天左右。 程序员不知道,请帮忙find原因,这里是最高的

每隔几天我的服务器突然崩溃,我必须要求在数据中心重置硬件才能恢复运行。 今天,我回到我的shell,看到服务器已经死了,“上面”正在运行,并在崩溃之前看到下面的“顶部”。 我打开/ var / log / messages并滚动到重启时间,在硬重启之前什么都看不到,没有错误。 (我检查了/etc/syslog.conf,看到“* .info; mail.none; authpriv.none; cron.none / var / log / messages”,是不是足以logging所有问题?) 通常当我看到顶部时,交换不会像这样用完! 我也不知道为什么mysqld是在323%的CPU(服务器只运行Drupal,它从不缓慢或超载)。 求解器是我的应用程序。 我不知道“sh”和“dovecot”在做什么。 它在上个月使我疯狂,请帮我解决这个谜,停止我的停工。 top – 01:10:06 up 6 days, 5 min, 3 users, load average: 34.87, 18.68, 9.03 Tasks: 500 total, 19 running, 481 sleeping, 0 stopped, 0 zombie Cpu(s): 0.0%us, 96.6%sy, 0.0%ni, 1.7%id, […]

避免内存已满 – > swap full – > crash

我遇到一个问题,当有时内存得到100%完整,交换文件也,并且服务器变得无法响应,并且必须重新启动(导致数据库中的问题)。 这就是仙人掌所显示的: 服务器正在运行一个Web应用程序(数据库+ Apache),在那段时间没有经历任何非正常的stream量或使用。 这种情况在上周发生了两次。 什么可以导致这个? 我该如何解决这个问题?

MySQL 5.1.49每两天冻结一次

我们的mysql系统每隔两天就“冻结”一次。 “冻结”我的意思是说: 它不响应ping 我们不能用SSHlogin 我们没有从MySQL获得任何答案 错误日志中没有条目! 从Linux既不是从MySQL。 我们已经变成了一个全新的硬件,我们也遇到了同样的问题,所以绝对不是硬件问题。 我们没有安装除防火墙以外的其他软件(iptables规则) 我们可以使用rsyslog(www.rsyslog.com)(软件重置)从另一台服务器重新启动服务器, 有人能帮助我,通过给我一些指点,我能做些什么来找出问题? 我已经包括了关于我们设置的每个细节。 预先感谢您的帮助。 最大。 我们的系统参数和设置: 系统内存:12GB 处理器:Intel 7-920 Quadcore 操作系统:Debian 5(lenny)64bit MySQL 5.1.49 数据库:(a)一个小的phpbb论坛(b)一个6GB的数据库3个表,大约有1500万行 my.cnf中 # #MySQL数据库服务器configuration文件。 # #您可以将其复制到以下其中一个: # – “/etc/mysql/my.cnf”设置全局选项, # – “〜/ .my.cnf”设置用户特定的选项。 # #可以使用程序支持的所有长选项。 #使用–help运行程序以获得可用选项列表 #–print-defaults,看看它实际上会理解和使用。 # #说明见 #http://dev.mysql.com/doc/mysql/en/server-system-variables.html #这将被传递给所有的mysql客户端 #据报道,密码应该用蜱/引号括起来 #escpecially如果他们包含“#”字符… #请记住在更改套接字位置时编辑/etc/mysql/debian.cnf。 [客户] 端口= 3306 socket = /var/run/mysqld/mysqld.sock #这是一些特定程序的条目 #下面的值假设你至less有32M […]

如何从系统崩溃中获取更多信息

我想debugging一个Linux(Debian稳定版)服务器的问题,但是我正在想出如何确认任何诊断。 一些背景:服务器正在两个磁盘之间运行硬件RAID的DL160类。 他们正在运行大量的服务,主要是利用networking接口和CPU。 有8个CPU和7个“主”,大多数cpu饥饿进程通过cpu亲和力绑定到一个核心。 其他随机背景脚本不会强制任何地方。 文件系统一直在写〜1.5k块/秒(在高峰时间上升到2k / s以上)。 这些服务器的正常CPU使用率在7核上是〜60%,最后一些是最小的使用率(通常在shell上运行)。 实际发生的情况是,“主”服务在某个时刻开始使用100%的CPU,主要滞后于内核时间。 几秒钟后,洛杉矶超过400,我们失去了任何方式连接到框(KVM是在它的方式,但还没有)。 有时我们看到一个内核报告挂起的任务(但并不总是): [118951.272884] INFO: task zsh:15911 blocked for more than 120 seconds. [118951.272955] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [118951.273037] zsh D 0000000000000000 0 15911 1 [118951.273093] ffff8101898c3c48 0000000000000046 0000000000000000 ffffffffa0155e0a [118951.273183] ffff8101a753a080 ffff81021f1c5570 ffff8101a753a308 000000051f0fd740 [118951.273274] 0000000000000246 0000000000000000 00000000ffffffbd 0000000000000001 [118951.273335] Call Trace: […]

我的Apache很慢,崩溃

我有我的VPS服务器安装apache2。 10,000个人连接到这个站点,现在速度很慢,而我的CPU是1.25%,I / O是20B /秒。 我有644 MB的可用内存和使用只有347。 我的apache2.conf现在是: StartServers 5 MinSpareServers 5 MaxSpareServers 10 MaxClients 20 MaxRequestsPerChild 0 KeepAliveclosures。 我找不到为什么这么慢。 你怎么看? 谢谢。

排除debian 6服务器重启的故障

前一天我安装了Mono 2.10(对于C#4的支持)。 从那以后,服务器随机重新启动,只要C#应用程序运行时没有错误消息或任何东西。 uname -a Linux ns3001599.ovh.net 3.2.13-grsec-xxxx-grs-ipv6-64 #1 SMP Thu Mar 29 09:48:59 UTC 2012 x86_64 GNU/Linux 单-V Mono JIT compiler version 2.10.8.1 (Debian 2.10.8.1-4) Copyright (C) 2002-2011 Novell, Inc, Xamarin, Inc and Contributors. TLS: __thread SIGSEGV: altstack Notifications: epoll Architecture: amd64 Disabled: none Misc: softdebug LLVM: supported, not enabled. GC: Included Boehm (with […]

Ubuntu 10.04 Xen guest – 为什么时间漂移会与系统负载成比例?

我们正在尝试在Ubuntu MySQL 5.1服务器上的中等负载下解决随机系统locking问题。 在这些locking期间没有任何login到系统。 日志logging唯一的任务是在任务kjournald,mysqld等控制台“任务挂起120秒”,当负载尖峰命中,系统完全崩溃。 在dmesg日志里什么也没有。 另一个奇怪的事情(这可能会或可能不会涉及到上面)发生在系统负载是时间漂移。 系统上的负载与时间差成比例。 我已经尝试删除/var/lib/ntp/ntp.drift,但它不断回到500.00。 内核版本是2.6.38-15-服务器,Ubuntu 10.04,在Xen 3.4内核/主机下运行。 有任何想法吗?

Server 2012 DFS新成员问题

我正试图添加一个新的成员到我们的DFS拓扑。 我们有3台运行Windows Server 2012的服务器(虚拟机 – VMware),两台服务器位于主站点,另外三台位于灾备站点。 目前,我们主站点上的两台服务器正在复制DFS(全网格)并且正常工作。 我已经尝试了几次,将第三个DC添加到我们的DFS拓扑中,每当我configuration复制path时,例如E:\ MSI,然后单击确定MMC快照崩溃。 下面是崩溃信息,任何想法是什么造成这个? 我所做的是相当直接的,不明白为什么会发生这种情况。 Windows崩溃错误: gnature: Problem Event Name: CLR20r3 Problem Signature 01: mmc.exe Problem Signature 02: 6.2.9200.16496 Problem Signature 03: 50ece2e8 Problem Signature 04: System.Windows.Forms Problem Signature 05: 4.0.30319.18046 Problem Signature 06: 51552cda Problem Signature 07: 6291 Problem Signature 08: 25 Problem Signature 09: RML5K4UDBMA5NI04CIYRWVDHKEWFDHCV OS Version: […]

Apache服务器连续停机

我一直在CentOS 5服务器上运行一个网站大约一年。 一切都很好,直到我注意到我的服务器上奇怪的停机问题。 我只是看看系统图,我看到系统内存已经超出,然后Apache服务脱机。 到目前为止,我一直在接受这种types的停机,但是我不知道可能是什么问题。 我有一些日志文件,我发现了一些奇怪的东西,但我不知道是否相关。 当服务器closures时,我在var/log/httpd/ssl_error_log得到这个日志 [Thu Oct 31 *** 2013] [warn] RSA server certificate is a CA certificate (BasicConstraints: CA == TRUE !?) [Thu Oct 31 *** 2013] [warn] RSA server certificate is a CA certificate (BasicConstraints: CA == TRUE !?) [Thu Oct 31 *** 2013] [warn] RSA server certificate is a CA […]

如何分析一个Windows系统挂起(而不是崩溃)

我有一个间歇性系统挂起的客户。 大小写系统是Windowsterminal服务器2008R2 SP1。 有时服务器中的一个会话会冻结。 其他人都可以像往常一样工作,但这一个用户不能再次login,即使服务器关机不会closures会话。 我获得Memory.dmp文件使用ctrl +滚动locking方法,但当然这些只是告诉我“用户手动启动这个崩溃转储”。 那么我将如何继续debugging? 有没有办法从转储或其他可能有用的东西获得最活跃的进程? 我试过DebugDiag 2.0,但它在转储崩溃,所以这是对我没有帮助:(