我的服务器造成了太多的stream量,所以我安装了ntop来监视它。 在“ 全局TCP / UDP协议分发”表的“ 摘要” – >“stream量”页面上,我可以看到stream量是由HTTP定期引起的。 在所有协议 – >交通页面在第一行有交通(94,4%)。 但第一列(主机)显示我自己的服务器。 为什么是这样? 点击那里,我可以看到主stream量统计表中的stream量 。 这一切都在TOT。 交通Rcvd列。 因此,我认为,我的一个应用程序定期下载一些大的,或很多。 但是如何找出,下载了什么? 什么是下载的URL或至less是造成最多stream量的主机?
如何监控Jetty实例的健康状况,并在内存不足时自动重新启动实例?
可能重复: 你用什么工具来监视你的服务器? 任何人都可以推荐网站监测服务? 我公司为我们的客户build立和维护网站。 在任何给定的date,我们有400-600个网站活跃。 我们每周build立5-10个类似的数字。 我们已经为每个站点启用了基本的“现场实时”监视,但是我想扩展它。 在我们build立自己的之前,我正在寻找build议。 监控将围绕每个站点而不是服务器(所有站点都在负载平衡的物理服务器池上运行)。 对于每个网站,我们要监控不同类别的信息,例如: 注册项目:域名到期,SSL证书过期。 这些数据来自现场检查。 实现清单:通过数据库查询和/或发出HTTP请求检查数据,并将结果HTML与正则expression式进行比较 性能指标:访问,转换等数据查询检查数据。 由于我们经常添加/删除网站,我们需要通过API或其他自动化方式添加和删除网站。 我看了一下Nagios , Icinga和Zenoss 。 虽然这些扩展插件和API,物理主机上的每个中心。 我们真的需要能够一目了然地查看哪些突出显示有问题的网站,然后深入查看问题所在。 有没有find我需要的工具? 有没有人以非服务器为中心的方式使用其中的一种?
我有一个DC的Exchange 2003。 以下是我可以使用的度量标准,以便从中创build图表,或者只是监视其状态: EXNG: Inbound Connections Current EXNG: Local Queue Length EXNG: Local Retry Queue Length EXNG: Memory Available Bytes EXNG: Memory Pages\sec EXNG: Messages Received/sec EXNG: MSExchangeMTA Submits EXNG: Page File Usage EXNG: Pickup Directory Messages Retrieved/sec EXNG: Remote Queue Length EXNG: Remote Retry Queue Length EXNG: Service State – Event EXNG: Service State […]
我希望能够解决这个问题的一半是Nagios,但我只是想检查一下我们在基础架构和自定义应用程序方面的特定要求。 我们需要监控下面列出的自定义事件: 如果在特定文件夹中存在超过30分钟的.CSV或.TXT,则发出警报 警告如果特定的POP3邮箱有超过3个项目在那里 一个特定的文件夹应该每天有一个1700的模式“standard_file_name_ddmmyy”的文件 一个XML文件应该在每天早上0300以前,在周末除外。 本质上,它是监视不同的文件相关的活动,否则很难保持。 有什么build议么?
我正在寻找一个监控系统(在Linux上运行),可以监控最常用的操作系统,并有一个Android的应用程序来显示服务器的状态。 任何人都知道这样做的软件?
我想用cgroups来限制linux中的资源 http://en.wikipedia.org/wiki/Cgroups 如果碰到一个限制,我怎么能通知。 例如,如果我将进程限制为2个演出或ram,如果我没有主动监视它,我将如何知道它何时到达?
我知道我可以编写一个cron作业,它将以批处理模式运行,并将输出写入一个文件,但是我正在寻找比这更优雅的东西。 另外我知道sysstat(萨尔),但我正在寻找更详细的过程数据。 有这样的事情吗?
我在交互模式下使用nmon监视许多服务器上的磁盘活动,每个服务器上都有几个硬盘驱动器。 nmon显示硬盘驱动器的顺序在不同服务器之间有所不同,我希望所有服务器上的顺序相同。 请注意,我正在使用交互模式(从命令行启动nmon,然后按d键)。 我已经尝试使用磁盘组文件( -g启动选项)每行只有一个磁盘,但它的输出是不容易读取,因为它不使用加载的graphics表示方式D做。 更新 显然没有其他的方法,因为nmon使用相同的顺序作为/ proc / diskparts,这是很难改变。 例如,这是在一台服务器上输出的: ┌nmon─12f─────────────────────Hostname=testhost001──Refresh= 1secs ───16:19.38────┐ │ Disk I/O ─────(/proc/diskstats)────────all data is Kbytes per second────────────│ │DiskName Busy Read WriteKB|0 |25 |50 |75 100| │ │sda 0% 0.0 0.0| > | │ │sda1 0% 0.0 0.0| > | │ │sda2 0% 0.0 0.0|> | │ │sda5 0% 0.0 […]
操作系统:CentOS版本5.7(最终)Net-SNMP:net-snmp-5.3.2.2-14.el5_7.1(来自RPM) 我的NMS定期通知我这台机器上的SNMP已经closures了。 该服务在10到30分钟之间恢复。 我的NMS还ping和检查SSH,这些服务在SNMP中断期间不受影响。 SNMPD日志文件显示它正在工作,显然正在接收数据包(来自127.0.0.1的本地代理或来自我的NMS的172.16.37.37),但试图在本地snmpwalk或从NMS系统进行snmpwalk失败并超时。 我有7台运行CentOS 5.7和RHEL 5.7的混合服务器,这些特定版本的Net-SNMP是从RPM安装的 – 除了这个之外,他们都没有这个问题。 5台机器(包括NMS系统和这个问题服务器)使用一台交换机连接在同一个机架上。 重新启动SNMPD并不能解决问题 – 最终会自行清除。 任何build议,我可以开始诊断问题? 这是一个封闭的子网,所以不使用IPTables。 SNMPDconfiguration如下: # Following entries were added by HP Insight Management Agents at # Tue May 15 10:58:17 CLT 2012 dlmod cmaX /usr/lib64/libcmaX64.so rwcommunity public 127.0.0.1 rocommunity public 127.0.0.1 rwcommunity 3adRabRu 172.16.37.37 rocommunity 3adRabRu 172.16.37.37 rwcommunity 3adRabRu 172.16.37.36 rocommunity 3adRabRu […]