监控服务器 Gind.cn

监视networking延迟

我们遇到了一些networking问题，但并不确定问题最能影响用户的时间或地点，我希望每隔几分钟就能查看一堆url并绘制结果图。有一个简单的包在Mac上做到这一点？

我如何监视SQL服务器上失败的作业步骤？

我们有两个MS SQL服务器（一个2000和一个2005），在白天和黑夜的不同时间运行一些工作。这些作业有许多步骤，将从Informix数据库（我们的业务系统）中提取数据，并更新表以供各种报告和生产系统使用。我们周末的这些import产品出现了故障，导致许多报告系统提供了错误的数据。由于安全限制，我们无法从服务器发送电子邮件，因此我们如何能够有效地监控这些作业，而无需经常检查企业pipe理器或MS SQL Studio中的作业状态？是否可以在服务器上运行查询并查找各种作业的状态？

自动系统日志错误解决scheme查找器

任何自动化的syslog解决scheme查找框架？我希望我的中央系统日志服务器通过电子邮件发送问题列表，其严重性和build议的解决scheme 。关于集中系统日志和备用日志分析系统有几个问题，但我不觉得它们中的任何一个都有助于解决问题。一点背景：在工作中，我现在正在从事两个人的工作，两个工作都超出了他们最初的框架。这不像我有助手那样糟糕，但他们只不过是聪明的猴子。虽然我的前任之一（我有两个人，那就是我如何知道我有两个人的工作）build立logging，通过电子邮件发送结果，我的猴子没有必要的技能来识别不重要的数据。这使得他们和我自己可悲地设置了电子邮件filter，并忽略了整个事情，直到发生“爆炸”。让其他人告诉他们什么是重要的，什么是连接的，并提出一些解决问题的方法（我可以先训练然后研究解决scheme，哈！），这将是很方便的。我对Splunk和Octopussy网站的阅读表明，我仍然需要把自己训练有素的猴子带到聚会。我有几年没有了。

哪个工具提供了每个进程（或每个cgroup）资源（RAM / CPU /磁盘）监视？

我想得到有关CPU使用率，RAM使用率，由我的服务器（运行Debian）上的特定进程（或进程组或cgroup）导致的磁盘使用率的图表。这个工具需要是FOSS，如果有Debian软件包，这是一个好的方面。如果资源X> 75％，那么该工具不需要进行监控，只要提供图表就足够了。

为什么我从dom0和domU获得不同的networkingstream量值？

我使用Xen 4.0.1和Linux 2.6.32-5-xen-amd64（Debian Squeeze系统上的标准软件包）。从Xennetworking ：对于每个新的domU，Xen创build一对新的“连接的虚拟以太网接口”，一端在domU中，另一端在dom0中。对于linux domU来说，它所看到的设备名称是eth0。虚拟以太网接口对的另一端作为接口vif <id＃>存在于dom0中把它们想象成两个通过内部交叉以太网电缆连接的以太网接口。我对这个内部交叉事物的理解是，无论你在dom0（ vifN.N接口）还是在domU（ eth0接口）中测量，联网统计都应该是一样的。 RX / TX值应该相同，只是倒置。不过，当以dom0衡量stream量时，我的数值会增加20％。我的问题是为什么价值是（那）不同？启动来宾域： root@dev1:/etc/xen# xm create node2050.cfg Using config file "./node2050.cfg". Started domain node2050 (id=35) root@dev1:/etc/xen# xm list node2050 Name ID Mem VCPUs State Time(s) node2050 35 256 1 -b—- 2.5 root@dev1:/etc/xen# ip address show […]

衡量从互联网下载的内容量 – SQUID

我已经build立了一个鱿鱼代理，现在想监视正在发生的数据传输量。这将是很好的每个域的数字，也是多less内容来自caching。有没有办法做到这一点？

监视服务器以了解自动化软件以外的更改

我工作的公司目前正在研究为我们的服务器（所有Ubuntu / FreeBSD）部署集中式自动化系统（如Salt或Puppet）。我们可能会跟盐一起去，但我认为这与我的问题无关。我的问题：有没有一种好的方法来监控机器上是否包含自动化系统中未包含的本地更改？例如：为了快速修复，某人在给定机器上启动了服务或修改了configuration文件。有没有办法使用Salt / Puppet /什么来检查这些东西？或者我需要使用像AIDE这样的外部程序吗？

Nagios警报通过电话？

我有几个nagios服务器，目前通过短信和电子邮件提醒我，但我想添加传出的电话。理想的解决scheme是让nagios机器打电话给我的手机，在通话过程中播放mp3 / wav，让我知道有什么地方是错误的。我唯一的问题是，我不知道如何去做到这一点。我怀疑我可能不得不购买PBX卡来做这件事，但我希望这里的某个人做了类似普通的调制解调器和现成的软件。任何想法或提示？

什么是一些好的方法来识别在NFS服务器上造成高负载的NFS客户端

有时我的nfs4服务器处于高负载状态。有什么好的工具可以识别哪个客户端导致它。在nfs服务器上运行iotop和nfsstat只显示无助于识别nfs客户端的一般负载信息。我不想遍历所有可能的nfs客户端，并在其上运行提及的工具。我提出的最佳解决scheme是在服务器上运行tcpdump，然后按照与nfs相关的通信量对ip地址进行sorting。有没有更好的方法来做到这一点？

收集是收集系统指标的好select

收集了一年左右的经验。我记得它的速度和灵活性令人印象深刻，然而它从未被采用作为收集指标的主要来源，运行脚本将statsd / graphite / nagios发送数据的cron作业仍然是事实上的select。在收集了一些被认为不太准确的指标之后，这个问题最近又出现了。而且我想知道collectd是否仍然被认为是这样一个任务的好select，或者有更好的东西可以做这个工作。度量收集的要求是：他们至less收集一分钟通过木偶或厨师轻松部署对JVM，系统进程，MySQL，postgress，haproxy等开源平台组件的支持深度我会有兴趣听到有这方面经验的人

Intereting Posts

如何在DNS中input强大（长）的DKIM密钥？ TFS2012构buildSharePoint 2010和2013的服务器从电脑查询Mac电脑 nginx不向外部IP地址提供请求 MySQL / MariaDB停止运行。我如何找出原因？我们的防火墙能检测networking内部的stream量嗅探吗？我怎样才能得到一个域名与godaddy的托pipe？从厨师到木偶的过渡：如何在编写模板时search节点？ QMAIL反弹回原始发件人？ Server 2008 R2任务计划程序权限为一个VBS脚本我怎样才能解决我的依赖问题与resolvconf / dnsmasq安装脚本？ Filezilla服务器：如何给读取和修改文件只有权限 CentOS中的MySQL无法启动服务 Outlook会议请求和邮件重新发送或重复 – Exchange 2003 从CentOS5框安装CentOS6？

Articles of 监控