Articles of 故障排除

如何解决Windows? 张贴您的清单

有时候Windows会突然疯狂:缓慢,反应迟钝,有些东西不起作用,崩溃。 我想知道你如何诊断这些问题。 我只是一个程序员,不太了解Windows。 可能有更多像我这样的人…我坚信,有经验的Windowspipe理员有一些有用的技巧,可以使诊断更容易。 请张贴您的技术,更先进/棘手/不规范,更好。

安装KB3200970和KB3202790更新之后的DNS问题

在我让Windows运行一周前更新之后,我已经注意到了这些问题。 O这个问题在这里说明。 发生什么事情是,当我打开一个链接(或一个新的标签等),很可能是第一个请求会给我的URL错误页面没有DNS的条目,但刷新它解决它就好了。 如果页面上还有其他的域名被要求(例如作为一个embedded的图片),他们也有很大的失败的可能性,导致很多情况下,最终检索的页面是一个纯文本白页。 再刷新一次,大部分问题都完全消失了。 这似乎是发生在系统范围内,只是我可以通过Chrome或Firefox轻松“查看”它的唯一途径。 这个问题似乎并没有出现在我的手机上(而在Wi-Fi下)。 我不知道是什么原因导致这个突然 – 我已经运行了几个恶意软件扫描,没有任何修复它,我已经尝试使用谷歌的公共DNS以及OpenDNS,也没有修复它(在前一种情况下,我经常得到在Google上search时出现DNS错误)。 任何帮助解决这个将非常感激。

networking速度慢 – 我应该检查什么?

用户报告说,访问networking上的文件,浏览内部网站等需要很长时间。我应该检查什么?

执行根本原因分析

我想了解更多关于如何执行根本原因分析。 更多的时候,我们的部门告诉用户尝试重新启动(他们的Windows XP系统),这实际上“修复”了很多问题。 当我匆忙(有时每小时付钱都会对此有所贡献)时,我可能会尝试find解决方法,以便快速解决问题,而不是实际执行根本原因分析。 大部分时间我正在查看日志文件或事件查看器中的这些信息。 有时我会使用Sysinternals工具或者偶尔运行一个数据包嗅探器。 我可能不会像我应该那样使用Sysinternals程序。 关于如何使用这些工具的具体见解,何时以及为什么也会有所帮助。 我知道这是一个悬而未决的问题,但请您简要介绍一下您使用的方法,工具等。 看起来很多SF上的pipe理员使用更深入的过程,我想了解更多。 如果这有助于缩小问题的范围,那么我会对与AD环境中的Windows服务器和客户端相关的工具,提示,技巧等问题感兴趣。

针对非常差的iSCSI / NFS性能的故障排除策略

我们有一个新的Synology RS3412RPxs,可以为三个Windows 2008 R2盒子和NFS提供iSCSI目标到一个OpenBSD 5.0盒子。 使用sshlogin到RS3412,使用dd和各种数据块读取和写入小文件和6GB文件,都可以获得出色的磁盘I / O性能。 在iSCSI / NFS客户端上使用dd或iometer,我们可以达到20Mbps(这不是一个错误的20 Mbps)。 我们有点希望能够更好地使用Synology中的多个Gbit网卡。 我已经validation交换机和网卡端口configuration设置为千兆,而不是自动协商。 我们尝试了使用和没有Jumboframe没有区别。 我已经用pingvalidation了MTU目前是9000.已经部署了两个固件升级。 我将尝试iSCSI目标和启动器之间的直接链接以排除交换机问题,但是我的其他选项是什么? 如果我打破wireshark / tcpdump,我该找什么?

当一个未被感染的unix服务器开始狂暴时,你检查的第一件事是什么?

所以,你有这个整齐的设置UNIX服务器,它超快速和膨胀,一切都是好几个月,突然各种奇怪的错误开始显示出各种不同的服务,没有一个自己很有意义,更less一起。 什么是便宜的东西,你应该检查一旦你的SSH会话的机器? 我特别感兴趣的是那些突出显示非显而易见的命令和罕见情况的创伤故事,但是我认为明显的因人而异,所以我们可以自由地列出它们。

如何解决无线问题?

有时我必须排除我的局域网上有片状无线连接的机器,而没有任何看似合乎逻辑的原因。 与大多数情况下的“正常”networking连接相反,我不知道从哪里开始debugging或解决问题。 任何提示? 谢谢!

无法在生产环境中注销,断开连接或重置terminal服务器用户

我正在寻找一些关于如何断开,注销或重置2008terminal服务器中的用户会话的一些想法(无法以用户完全locking的方式login)。 这是一个生产环境,所以重新启动服务器或者在系统上做一些事情现在已经不存在了。 任何PowerShell技巧来帮助我们呢? 我们尝试断开连接,将用户closures并重置会话以及直接从相同的terminal服务器(从任务pipe理器,terminal服务pipe理器和资源监视器)直接终止会话的进程,而没有任何结果。 帮帮我! 更新:我们结束了重新启动服务器,因为没有其他的尝试,我们可以想到的工作。 我会留下这个问题,希望有人可能有更多关于这个问题的信息,这是潜在的修复

为什么我的ping通过与ping不同的IP地址回答?

在尝试设置MSSQL群集解决scheme时,我遇到了一个与我的networking相关的专业知识之外的问题。 我试图find一个免费的IP用于我的节点。 我问networkingpipe理员给我一个免费的IP地址。 为了争辩起见,他给了我10.40.1.205的知识产权,这个知识产权应该是未使用的。 当在群集设置期间尝试使用给定的IP时,SQL抱怨IP已被使用。 我尝试从我的服务器ping IP,我得到了回答说… 10.40.59.69 …? 任何想法可能会导致这样的事情,更重要的是如何排除故障?

高CPU利用率,但平均负载较低

我们遇到了一个奇怪的行为,我们看到高CPU利用率,但平均负载很低。 我们的监测系统中的下列图表可以很好地说明这一现象。 在大约11:57,CPU利用率从25%上升到75%。 平均负载没有显着变化。 我们运行12个核心的服务器,每个都有2个超线程。 操作系统认为这是24个CPU。 通过每分钟运行/usr/bin/mpstat 60 1来收集CPU利用率数据。 all行和%usr列的数据如上图所示。 我确信这确实显示了每个CPU数据的平均值, 而不是 “堆积”利用率。 虽然我们在图表中看到75%的利用率,但是我们看到一个过程显示使用大约2000%的“堆叠式”CPU。 平均负载数字取自/proc/loadavg每分钟。 uname -a给出: Linux ab04 2.6.32-279.el6.x86_64 #1 SMP Wed Jun 13 18:24:36 EDT 2012 x86_64 x86_64 x86_64 GNU/Linux Linux dist是Red Hat Enterprise Linux Server release 6.3 (Santiago) 我们在相当重的负载下运行一些Java Web应用程序,认为每台机器100个请求/秒。 如果我正确解释CPU利用率数据,当我们有75%的CPU使用率时,这意味着我们的CPU平均在75%的时间内执行一个进程。 但是,如果我们的CPU占用75%的时间,我们不应该看到更高的平均负载吗? 如何在运行队列中只有2-4个作业的情况下CPU占用率达到75%? 我们是否正确解释我们的数据? 什么会导致这种行为?