Articles of 分析

如何从系统崩溃中获取更多信息

我想debugging一个Linux(Debian稳定版)服务器的问题,但是我正在想出如何确认任何诊断。 一些背景:服务器正在两个磁盘之间运行硬件RAID的DL160类。 他们正在运行大量的服务,主要是利用networking接口和CPU。 有8个CPU和7个“主”,大多数cpu饥饿进程通过cpu亲和力绑定到一个核心。 其他随机背景脚本不会强制任何地方。 文件系统一直在写〜1.5k块/秒(在高峰时间上升到2k / s以上)。 这些服务器的正常CPU使用率在7核上是〜60%,最后一些是最小的使用率(通常在shell上运行)。 实际发生的情况是,“主”服务在某个时刻开始使用100%的CPU,主要滞后于内核时间。 几秒钟后,洛杉矶超过400,我们失去了任何方式连接到框(KVM是在它的方式,但还没有)。 有时我们看到一个内核报告挂起的任务(但并不总是): [118951.272884] INFO: task zsh:15911 blocked for more than 120 seconds. [118951.272955] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message. [118951.273037] zsh D 0000000000000000 0 15911 1 [118951.273093] ffff8101898c3c48 0000000000000046 0000000000000000 ffffffffa0155e0a [118951.273183] ffff8101a753a080 ffff81021f1c5570 ffff8101a753a308 000000051f0fd740 [118951.273274] 0000000000000246 0000000000000000 00000000ffffffbd 0000000000000001 [118951.273335] Call Trace: […]

在分析日志中识别testing机器

我们刚刚开始将分析添加到我们的SaaS应用程序,以便根据使用情况开始(除其他之外)对客户端进行收费。 我们遇到的问题是在一些情况下,我们的支持团队将模拟login到生产环境,以尝试重新生成客户端configuration报告的问题。 当他们login时,我们将在我们的分析日志中logging他们的特定帐户已经login的logging,我们用它来计算帐单。 我们有一些想法来解决这个问题: 1)我们logging每个login的PC的IP地址和机器密钥 – 我们可以过滤已知的IP地址和/或属于支持的机器密钥。 缺点是我们必须手动维护一个键/地址列表。 2)如果支持(或其他任何内部)以debugging模式运行我们的应用程序(而不是发布),则不会报告分析。 这很好,只要支持/其他人记得切换到debugging模式。 3)在configuration生产系统以发送分析时,需要包括某种需要设置的注册码/类似设置。 再次好,只要我们的基础设施团队记得设置注册码或设置。 所有这些方法都需要某种人的参与,我们都知道最好的情况可能是这样。 有没有人遇到类似的情况? 有没有自动化的方法来解决这个问题? (PS>当然,我们不应该在生产中进行testing,但是有一些客户build立的一次性实例,如果没有在生产环境中login,我们不能复制,这是我们唯一的一次,这就是我在这个问题上谈论的情况。)

从模拟中分析原始数据(networking统计数据)的最佳方式/工具是什么?

在模拟networking(使用模拟器(QualNet))运行仿真networking之后,我最终获得了存储在数据库中的ip统计数据,然后将数据提取到一个csv文件。现在我有750mb的原始networking统计数据(时间戳,数据包ID,源IP,源端口,协议等)。 如果您想了解丢包,吞吐量,延迟,拥塞等情况,分析上述大量数据的常见方法是什么?

从openwrt防火墙规则中排除IP地址

我正在使用带有openwrt的wrt54gl来尝试将局域网上的所有stream量redirect到特定的服务器,这将运行scapy和其他networking分析工具,并作为Internet的网关/防火墙。 到目前为止,我已经设法通过使用防火墙规则将所有LAN通信redirect到我的服务器: config 'redirect' option 'src' 'lan' option 'dest_ip' '192.168.1.54' 它的工作原理,我可以拿起服务器上的scapy数据包。 但现在我的问题是,从我的网关/分析服务器的数据也被redirect到自己。 我正在寻找一种方法来排除服务器的IP从redirect规则,我已经尝试与'!' 操作数,但防火墙返回一个错误,并没有考虑到它。 我也试图把我的服务器放在非军事区,遵循openwrt howto 。 我希望能够基于vlans制定防火墙规则,但似乎无法从DMZ访问互联网,并且第一个vlan也无法访问DMZ。 我肯定在某个地方犯了一个错误,但是我不知道在哪里 如果你有防火墙规则或者vlan或者其他的解决scheme,我会非常感激,因为在过去的三天里我一直在为此而苦苦挣扎。 非常感谢。

测量/跟踪页面加载时间

我有几个只能访问一个网站的员工。 他们使用的这个网站绝对是他们所做的一切,他们已经开始告诉我,一天的某些时段有多慢。 在一天的某些时候,当它变得非常糟糕的时候,他们会点击一个button来提交一个表单,并且这个请求将会花费很长时间,并且会超时并重新login。 让我清楚,唯一慢的是网站。 这不是加载IE的时间 有问题的网站与我们公司无关,由另一家公司控制。 我们和他们之间的联系没有什么特别之处。 我们公司没有其他人抱怨互联网访问速度慢或者其他任何会导致我相信这个问题出现在我们的networking上的东西。 运营该网站的公司的IT经理说:“我们有150个网站,因为贵公司是唯一报告问题的网站。” 为了消除我们的networking作为罪魁祸首,我想到了几个不同的方式来testing。 用一张高速空卡将其中一个用户设置一两天。 这个问题是,用户然后没有过滤互联网访问。 把我的电脑拿出来,在他们使用电脑的同时和他们站在一起45-69分钟,并同时浏览另一个网站。 在这段时间里,我想跟踪加载每个页面需要多长时间,而不pipe域名。 然后,我可以把这件事带回另一家公司,并告诉他们,除了你的网站之外,其他一切工作都很好。 我还没有find任何软件,将帮助我的想法#2。 有什么build议么? 你能想到其他的东西可以帮助确定问题出在哪里吗?

快速/简单的方式来监控一个图像文件被Apache服务的频率

我们的分析软件通过embedded的javascript监控我们服务的HTML页面,但是我们有一些图像文件不包含在这些报告中,因为它们没有附加到任何HTML。 知道文件的名称/path,我正在寻找快速的(并且如果需要的话)脏的方法来确定Apache在每一天(或每小时?)提供给定图像的次数。

Hyper-V或VMware – 查找2个快照之间所做的所有修改/更改

我想要使​​用Hyper-V或Vmware,以便在清理基本快照和修改后的快照之后找出问题,以及两个映像之间的修改/差异以及更改内容。 VMware ThinApp是我能find的最接近的东西,因为它试图创build虚拟化应用程序,因为它显示在两个映像之间进行了修改。 我对创build虚拟化应用程序不感兴趣,我对我们的一些自定义旧应用程序的工作方式以及安装位置感兴趣。 这也可用于安全目的,以查看病毒或恶意软件对系统所做的更改。 任何人有任何想法如何衡量或解决这个问题?

通配符域与谷歌分析

我们网站上的每个用户都有他们自己的子域名(例如bob.example.com,elephant.example.com),他们将获得付款给他们发送到这个子域名的stream量。 如何连线Google Analytics,以便我可以分别查看每个域的统计信息(视图,国家,浏览器等)? 我不确定这是一个分析JS代码的事情,或者如果它已经跟踪,我无法在GUI中find它 我目前的Google Analytics代码是这样的 <script> (function(i,s,o,g,r,a,m){i['GoogleAnalyticsObject']=r;i[r]=i[r]||function(){ (i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o), m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m) })(window,document,'script','//www.google-analytics.com/analytics.js','ga'); ga('create', 'UA-123456-1', 'example.com'); ga('send', 'pageview'); </script> 任何援助将不胜感激,谢谢。

统计热链接的图像

是否有一个网站统计应用程序,可以告诉我有多less人盗链(或embedded)的图像? Google Analytics无法呈现HTML来收集信息,因此任何热链接的图片都不会被统计。 换句话说,我需要一个基于HTTP的networking分析应用程序(基于networking是首选)。

我怎样才能解释使用Windbg的Windows DMP文件分析?

我已经在这里上传了完整的debugging输出。 我有一个间歇性崩溃的Windows 7 RTM 64位机器,我设法加载正确的符号,并得到似乎是一个适当的分析。 我不知道该从哪里下来,或者去解决这个问题,因为它似乎是在tcpip.sys上指责它。 虽然我不知道如何阅读这个输出结果,但下面的WinDBG摘录似乎是相关的: CURRENT_IRQL:2 EXCEPTION_RECORD: fffff80000b9c058 — (.exr 0xfffff80000b9c058)ExceptionAddress:fffff80002abb2b6(nt!RtlEnumerateEntryHashTable + 0x0000000000000080)ExceptionCode:c0000005(Access violation)ExceptionFlags:00000000 NumberParameters:2参数[0]:0000000000000000参数1 :ffffffffffffffff尝试从地址读取ffffffffffffffff FOLLOWUP_IP:tcpip!IppFlushNeighborSet + ba fffff880`0186e22a 4885c0 test rax,rax SYMBOL_STACK_INDEX:8 SYMBOL_NAME:tcpip!IppFlushNeighborSet + ba FOLLOWUP_NAME:MachineOwner MODULE_NAME:tcpip IMAGE_NAME:tcpip.sys DEBUG_FLR_IMAGE_TIMESTAMP:4a5bc26e FAILURE_BUCKET_ID:X64_0x1E_tcpip!IppFlushNeighborSet + ba BUCKET_ID:X64_0x1E_tcpip!IppFlushNeighborSet + ba