我有一个服务于美国各地的网站。 我从一个Web服务器托pipe网站。
今天,有些人声称他们不能加载我的网站,我想知道这是一种互联网路由问题或DNS问题。
你将如何去确定究竟是什么问题? 最好,我不想问用户使用ping或nslookup,因为他们大多运行Windows盒,我不相信这些默认情况下安装。
谨慎的一句话:用户会根据所有与您的服务无关的问题报告“网站已closures”。 独立确认您的网站已经启动(询问朋友,使用您拥有的另一台服务器),然后立即怀疑自己的networking。 我将通过我自己的链接进行DNS检查: 什么是我的DNS? 谁运行您的DNS? 确保服务器对您的域名具有权威性,然后仔细检查名称服务器。
Ping和nslookup绝对可用在Windows机器上。 要求他们ping您并在您的主机名上执行nslookup,而且几乎可以确保通过正确configuration的连接(如google.com)访问。 尝试find他们的反应之间的模式。
有些事情我会按照粗略的顺序来检查潜在的网站问题:
top
的基本状态。 检查高负载,高CPU使用率,高IO等待和所有VM使用情况。 一个“高”的负载取决于服务器/应用程序,但通常超过10个可能太高,2-10个东西要检查。 当你更熟悉你的服务器和stream量时,你会开始知道什么是好的/坏的。 top
, free -m
或vmstat
检查您的虚拟机使用情况。 任何重要的虚拟机使用情况都是不好的,并且表明某些内存使用的内存比应该多。 df
检查磁盘使用情况。 有时一个完整的磁盘或tmp分区可以用奇怪的方式performance出来。 可以使用smartctl
或系统日志文件检查磁盘错误/故障。 server-status
页面,看看服务。 netstat
也可以用来查看连接的数量/types,但是需要一些经验来知道要查找什么以及什么是正常的。 /var/log/messages
以及/var/log/messages
各种其他/var/log
以及任何特定于应用程序的日志(Apache,数据库等),并查找相关的错误消息。 当我遇到有人说“该网站已closures”时,我的反应/恐慌有多快取决于报告的内容和数量。 我可能会忽略一些只是说“该网站已closures”,但是发布具有错误代码/消息的详细报告的人会让我的移动速度更快,多个报告也会更快。
如果您不能重新创build问题,那么您绝对必须要求用户来帮助debugging问题。 他们通常非常高兴(如果他们有时间的话)。 接近他们的客户服务的帽子。
告诉他们关于www.downforeveryoneorjustme.com和引导他们通过基本的ping和traceroute。 找出它是DNS,路由还是服务器问题。
如果没有这个,你会在黑暗中随意刺伤,而不知道问题是否得到解决 – 这对你和你的用户来说都是令人沮丧的。 咬住子弹与他们联系,你的问题将在几分钟内回答。
Ping和nslookup(和tracert)默认在每个Windows操作系统上都可用。
由于问题可能与特定客户或地理区域隔离,因此我build议您确实让受影响的客户运行nslookup(第一个)以确保您的网站从其位置正确parsing,然后将tracert运行到该IP地址您的网站或networking入口(防火墙/路由器)。