Articles of 故障排除

服务器冻结 – 如何debugging

我使用Apache,PHP,MySQL运行Debian虚拟服务器。 只有一个网站stream量非常低,但服务器往往(几乎每天)冻结,不响应。 当发生这种情况时,服务器无法从Web浏览器或通过SSH,我必须去我的提供商的pipe理和执行服务器硬复位后,服务器似乎正常工作。 我怎样才能找出造成冻结的原因? Linux vm2797 2.6.32-5-amd64 #1 SMP Tue Jun 14 09:42:28 UTC 2011 x86_64 GNU/Linux

Postfix实际上并没有发送电子邮件

所以在遵循Ubuntu Postfix教程之后,我尝试了他们推荐的testing telnet localhost 25 MAIL FROM: [email protected] RCTP TO: [email protected] DATA some text here . 我收到一个成功的250 OK队列为C55230429543 但是,当我检查我的Gmail帐户(包括垃圾邮件文件夹),那里没有电子邮件。 任何想法,我可以检查,看看哪里出事了? Aug 25 22:34:06 mydomain postfix/cleanup[16130]: 23C20508CA: message-id=<[email protected]> Aug 25 22:34:06 mydomain postfix/qmgr[15822]: 23C20508CA: from=<[email protected]>, size=372, nrcpt=1 (queue active) Aug 25 22:34:12 mydomain postfix/smtp[16131]: fatal: specify a password table via the `smtp_sasl_password_maps' configuration parameter Aug 25 […]

NGINX在使用Blitz.io进行testing时使用100%的服务器CPU

我在这里遇到了一个问题,经过四天的考察,我决定在这里寻求一些帮助,毕竟一百万人的头脑比一个人想得更好。 我有一个与NGINX,HHVM,PHP5-FPM(作为备份),Percona MySQL,Memcached(将由Redis取代)的Ubuntu 14.04服务器设置。 我有fastcgi_cache设置为WordPress和对象caching完成通过memcached。 从理论上来说,这一切都很酷,但并不是在实践中。 这是一款带有2GB内存的RamNode OpenVZ SSD VPS和一个带有两个内核的Intel Xeon E5。 在其上运行Blitz.io,服务器正在被两个NGINX工作进程彻底谋杀,每个进程使用100%CPU根据top和htop。 我通常运行以下模式: –pattern 999-1000:60 https://www.geeksune.com/blog/hello-world/ 这使得CPU走向屋顶,根据Blitz.io这是这样的结果: 135个命中57,734个错误和234个时间 显然这不好。 内存使用一直保持在250MB以下,似乎所有来自Blitz.io的请求都在caching中,如下所示: 54.232.204.19 – HIT [23 / Nov / 2014:19:06:32 -0200]“GET / HTTP / 1.1”200 7632“ – ”“blitz.io; [email protected]” 注意开始时的HIT。 我设置了一个新的日志格式,并添加了$ upstream_cache_status。 在同一台机器上的一个类似的设置工作与Blitz.io很好,所以肯定是我的NGINX设置有问题,它似乎与fastcgi_cache相关。 每次我都有同样的结果,即使只有Zend的PHP5-FPM。 有没有人知道发生了什么? 我的configuration文件如下所示: /etc/nginx/nginx.conf – http://paste.ubuntu.com/9236266/ /etc/nginx/sites-available/geeksune.com – http://paste.ubuntu.com/9236282/ /etc/nginx/conf.d/includes/ssl.inc – http://paste.ubuntu.com/9236298/ /etc/nginx/conf.d/includes/security.inc […]

Bind9recursion查询具有间歇很长的响应时间

我在Ubuntu 12.04 LTS上运行BIND 9.8.1-P1caching服务器,内核3.2.0-86-generic-pae。 我已经把头撞在墙上试图弄清楚了几个星期,我只是不知道发生了什么,而且很难重现这个问题,因为它是非常间歇的。 现在发生的事情是,当用Firefox的networking监视器打开时,在Firefox中加载www.msn.com这样的网页时,偶尔会看到一些DNSparsing部分时间从8000ms到高达37000msparsing时间的请求。 当然,一旦我重新加载页面,它被caching,然后工作正常,但即使我刷新服务器和客户端上的caching突然,该域不再是一个问题。 我还没有看到任何域名有问题的模式。 我只是不知道如何解决这个问题,因为它很难复制两次相同的域。 以下是我在named.conf.options中的所有内容 options { directory "/var/cache/bind"; // If there is a firewall between you and nameservers you want // to talk to, you may need to fix the firewall to allow multiple // ports to talk. See http://www.kb.cert.org/vuls/id/800113 // If your ISP provided one or more IP […]

绑定接口的计算机在所有从设备接口上都不会收到组播报文

在将我们的机器从RHEL 6.6升级到RHEL 6.7之后,我们观察到一个问题,我们的30台机器中有4台只能在两个从机接口之一上接收组播stream量。 目前还不清楚升级是否相关,或者是否包含重新启动引发的行为 – 重新启动是罕见的。 我们希望在4个不同的端口上接收大量的239.0.10.200组播组。 如果我们在有问题的机器上检查ethtool统计数据,我们会看到以下输出: 健康的界面: # ethtool -S eth0 |grep mcast [0]: rx_mcast_packets: 294 [0]: tx_mcast_packets: 0 [1]: rx_mcast_packets: 68 [1]: tx_mcast_packets: 0 [2]: rx_mcast_packets: 2612869 [2]: tx_mcast_packets: 305 [3]: rx_mcast_packets: 0 [3]: tx_mcast_packets: 0 [4]: rx_mcast_packets: 2585571 [4]: tx_mcast_packets: 0 [5]: rx_mcast_packets: 2571341 [5]: tx_mcast_packets: 0 [6]: rx_mcast_packets: 0 [6]: […]

什么是networkingpipe理员必须支持VOIP的最重要的技能/知识集?

作为networkingpipe理员(思科交换机,与WAN提供商协作,协议分析),我有一个“客户的VOIP项目责任区”。 电信集团主要负责拨号计划,语音邮件和Avaya系统附带的监控工具,但是数据stream量超过了数据networking,因此我希望在某个时候参与其中。 QoS已经实现。 我还没有接受任何正式的培训,我所看到的大多数培训课程都与VOIPpipe理有关,而不是数据networking相关问题。

服务器性能问题 – Server 2008,SQL 2008和Hyper-V

我在我的服务器上得到令人讨厌的performance。 访问网站时会发生这种情况,但更常见的是,我第一次加载它。 服务器/ webapp仍然在开发中,所以我是唯一一个访问它。 具体而言,超时过期错误。 只能发布一个链接,所以截图如下… 我开始在数据库虚拟机上运行perfmon,在加载了几页之后,将它提升到了100! 这是截图 。 当它到了100,它仍然加载页面,只是有一个延迟。 在其他时候,我可以想象它变得更高。 而且,显然这个数字是100,所以它可能会更高,但没有显示出来。 这个问题似乎接近于描述这个问题,但林不知道该怎么办: SQL Server慢,但CPU正常 至于数据库访问,我的查询都是自动优化,通过使用linq-to-sql。 我不做数据库的任何索引…但现在的负载只是我打它。 所以,我的直觉告诉了我一些hyper-vconfiguration问题。 眼镜: 单服务器:Xeon E5520 @ 2.27GHz(2个处理器)。 Windows 2008 Ent。 6GB的rame,细分:2GB – 家长2Gb – DB服务器运行SQL 2008 Web版1.25Gb – 运行IIS7的Web服务器.75GB – DNS,Misc Hyper-V由托pipe公司设置,可能只是双击,然后点击下一步,直到完成,所以我认为必须有一些最佳做法的configuration,将使所有的差异。 帮帮我! 谢谢! 巴蒂尔。

解决Amazon EC2重新启动问题

我们有一台服务器(CentOS)在EC2上运行了几个月。 直到今天,我们得到了一个服务器不可用的警报(HTTP服务无法访问),一直非常顺利。 所以我尝试SSH进入框,但也超时了。 我login到EC2控制台,它说实例正在运行,系统日志中没有任何东西。 我注意到的一件奇怪的事情是,即使我们有一个Elastic IP(在Elastic IPpipe理区域中显示),但实例详细信息并未显示与该实例相关联的EIP。 我查看了消息日志,在我们得到警报的时候我看到的最后一件事情是dhclient更新了租约。 我猜测networking可能存在某种问题。 我该如何检查是否是问题所在,或者是否有任何其他问题可能导致我们的实例停止响应?

服务器脱机。 要找什么?

我通过GoDaddy使用了一个新的虚拟服务器,今天早上我收到了一个电话,告诉我我们的网站处于离线状态。 确认之后,我通过我们的GoDaddy控制面板请求了一个电源循环,服务器在一两分钟内恢复在线。 我打了电话,并报告说我们回来了。 当然,几分钟后,我们再次下降。 我尝试通过PuTTy进行连接,并要求我提供一个用户名,并且每个连续的提示都需要很长时间才能提出。 我正在使用CentOS。 所以我的问题是: 我怎样才能确定原因? 我可以做什么types的事来防止这种情况呢? 一个有趣的,也许是相关的观察是,昨天我们的带宽消耗比我们上个月的最高数字高出约20%。

与Microsoftnetworking负载平衡(Server 2003)不平衡加载

我是一家使用networking负载平衡(NLB)将我们的terminal服务器集中在一起的小公司的networkingpipe理员。 最近,由于符合PCI-DSS标准,我们更改了networking设置。 因此,我们引入了一个terminal服务网关,以确保stream量进入terminal服务器集群。 自从发生这种变化以来,我们的NLB集群就不会在主机之间均匀分布任何地方。 会发生什么事情是,一个主机将采取几乎所有的传入stream量,直到它停止或drainstopped。 我们已经在每台服务器上设置了负载权重,以试图缓解这个问题,但无济于事。 我们完全没有想法。 任何帮助将不胜感激。 谢谢。