Articles of 故障排除

他人工作环境中的问题解决礼仪

今天上午,一位明显的同事向我们的技术支持小组走来。 她注意到我们团队的一名成员改变了她的工作空间: 她的显示器被closures了(她预期待机模式)。 她的椅子设置被改变了。 她已经注销,我们的团队成员的名字之一在Windowslogin框中。 第一个问题似乎导致了混乱和沮丧,因为她想知道为什么她没有看到她的PC从备用节点恢复。 第二个问题似乎是需要尊重和安慰的触发器; 显然需要一段时间才能find合适的环境来感觉舒适。 第三个问题似乎是因为她想在1-2天的三个月假期之前完成工作。 我们的公司病毒扫描器在其旧版PC上可能需要1-2个小时才能完成每周扫描,这似乎是在login时触发的。 这降低了她的生产力。 当她听说为什么我们的团队可能需要做这些事情,她回到了一个愉快的状态。 但是我想知道什么“礼节”可以避免/最小化引发她的所有这些反应。 粗略的谷歌search和search在这里没有返回任何特别有见地的。 所以我想我会邀请读者回应,以便在解决其他人的工作空间问题时生成最佳实践列表。 提前感谢任何贡献。

解决“慢”networking问题

我们都抱怨说,“networking”在某些时候是“慢”的:可能是本地化到一个房间(交换机)或一台电脑,可能只是因特网(DNS?浏览器问题?),可能只是一个应用程序(长时间运行的SQL查询?AV扫描正在运行?)。 当你排除了明显的系统和/或应用程序问题时,你如何去testing一个networking缓慢或不稳定的行为? 你在OSI层上工作吗? 如果是这样,怎么去检查每一层? 你做什么来确保物理networking在未知的环境下是好的? 太多的广播或广播风暴呢? 第3层和以上? 路由跟踪? 任何其他的提示,方法,想法? 对于所有规模的networking必须具备的function和工具(端口镜像,SNMP,监控等)?

页面分配失败 – 我内存不足?

最近,我在其中一台服务器的kern.log中注意到这样一个条目: Feb 16 00:24:05 aramis kernel: swapper: page allocation failure. order:0, mode:0x20 我想知道: 这个消息到底意味着什么? 我的服务器内存不足? 交换使用率很低(低于10%),到目前为止,我还没有注意到由于内存不足而导致任何进程中断。 附加信息: 该服务器是运行Debian 6.0的Xen实例(DomU) 它有512 MB的RAM和512 MB的交换分区 虚拟机内部的CPU负载平均显示为0.25

您的故障排除规则,解决方法?

当您解决困难的networking/硬件/软件问题时,您是否有任何一般的规则? 例如:“我通过用第二台计算机testing外设来隔离问题的根源”或“我尽可能多地移除硬件以启动设备,然后逐个添加组件,直到我能重现问题”等等

Unix上正在运行的进程的环境variables?

我需要排除Unix系统中与环境variables有关的一些问题。 在Windows上,我可以使用ProcessExplorer等工具来select特定的进程并查看每个环境variables的值。 我怎样才能在Unix上完成同样的事情? echoing和env cmd只显示当前值,但我想查看当前运行的进程正在使用什么值。