短版本:我有一个使用Groundwork / Nagios进行监控的〜400个主机的异构环境。 当前的检查,主机组和服务组已经以有机的,专门的方式组合在一起。 我的任务是重build监视设置。 我以前的演出涉及less于20台机器,没有严格的正常工作时间要求,与Munin监控 – 这是我的经验。 我在基地寻找可以解决这个任务的过程 。 我对于为最终用户服务devise高级端到端检查有一个模糊的概念 – 例如试图login到我们的某个网站的刮板的东西 – 然后有一堆更具体的标准检查设置为相关检查 – 例如检查httpd是否正在运行,主机是否可以通过networking进入堆栈,只有在高级别检查失败时才会运行较低级别的检查,以便在发现根本原因的同时最大限度地减less系统应变。 我也一般在考虑把环境分开,这样团队只能在几个小时之后从生产环境中获取页面,就像那样。 这是理智的吗? 是否有devise监控系统的最佳实践方法? 我相信我有能力从我们目前不太理想的设备转移到更好的devise上,但是我想要一些关于如何devise理想设置的经验丰富的指导。
我有一个使用Zenoss / Zabbix / Nagios / OpenNMS / Opsview / Observium等开源软件的中央位置监控的不同远程VPS /“云”/共站服务器的networking……这些服务器不是必须在物理上彼此靠近。 我有一个合理的快速电路的服务器核心networking,其中之一将收集数据。 我需要尽可能地减less远程服务器上的负载(例如,一些小的256MB的web服务器,例如),所以我正在寻找解决scheme,呈现消耗最less资源的远程代理。 我希望能够监视每个设备上的进程/networking使用情况/日志/邮件队列等。 鉴于我的限制和架构,是否有一个特定的产品(开源),你会推荐?
我们使用Cacti和RRDTool来监视和分析大约1,000个基于Linux的节点上分布的大约100,000个计数器。 但是,我们目前的设置通常只给我们5分钟的图表(有些数据是基于分钟的)。 我们经常会在“接近实时”看到反馈意见的地方做出改变。 我需要一个星期5或10秒的数据,一年的1分钟的数据和5年的10分钟的数据。 我有SSD磁盘和一个双六核服务器备用。 我试着build立一个Graphite /碳/私语服务器,并且有大约15个节点pipe道连接到它,但是在升级到较老的桶时,它只有“平均”的保留function。 这几乎是无用的 – 我想要最小值,最大值,平均值,标准偏差,也许可能是“总数”和“样本数量”,或者可能是“第95百分位数”。 开发人员声称有一个新的后端“testing版”,允许您编写自己的function,但是这似乎仍然只保留1:1(当保存较旧的数据时,您确实希望将统计信息计算为来自单一的input,另外,“testing版”对于这个安装似乎有点冒险,如果我错了这个假设,我会很高兴能够显示我的错误! 我听说Zabbix推荐,但它把数据放入MySQL或其他SQL数据库。 5秒间隔100,000个计数器意味着20,000 tps,而我有一个SSD,我没有一个带电池备份caching的8路RAID-6,我想我需要这样做:-)再一次,如果这实际上不是问题,我会很高兴能看到我的方式的错误。 另外,Zabbix可以做单一的数据stream – >统计推广吗? 最后,Munin声称现在有一个新的2.0版本正在“testing版”中出现,它拥有定制的保留计划。 然而,这又是“testing”部分 – 是否有人将其用于真实和规模? 它是如何执行的,如果是这样的话? 我几乎想要使用graphics前端(如Graphite),并使用mmap()和一些统计信息之上的简单图层来滚动自己的保留后端。 这不会特别困难,并且可能performance得非常好,让内核找出在刷新到磁盘的频率和进程操作之间的平衡。 任何其他的build议,我应该看看? 注意:它必须certificate自己能够维持上面所build议的数据加载types; 如果你能指出你所引用的具体实现,那么更好!
我有Windows 2008域控制器。 我也使用这个服务器用户的共享文件夹。 我想知道在服务器端的用户共享文件夹文件移动。 例如,当有人将一个文件夹/文件从一个共享文件夹移到另一个文件夹时,我需要看到一个日志。 Windows 2008中是否有一个默认的工具? 还是有任何第三方工具?
Munin是相当详细的,并且在munin-cron每次运行munin-graph.log一些东西logging到munin-graph.log , munin-html.log , munin-limits.log和munin-update.log中。 我已经通过在munin-node.conf中设置了log_level 0来减lessmunin-node日志logging级别,并且运行良好。 munin-node.log只有在生成错误消息时才会更新。 不过,我也尝试在munin.conf添加相同的选项,但这会导致munin崩溃。 如何减less由慕尼黑写的日志量?
在Linux(和其他类Unix操作系统,如果有一个普遍的答案),是否有一个简单的方法来获得输出类似于time命令(当前实时,用户和系统CPU使用总量)仍然运行的进程?
我使用montit进行其他需要运行的进程,但是我有一个不能作为守护进程运行的进程,我不知道如何使用monit
目前使用Spiceworks来获取“inheritance”networking的工作站/应用程序清单。 我在PC上看到很多“不需要”的软件,想卸载这个软件,例如:Dealio,Coupon Printer,Ask toolbar,Weatherbug等。 我已经尝试了很多东西来卸载这个软件,包括: Psexec独立(psexec.exe带和不带-i,-s,用户凭证是否指定) WMI独立 这是spiceworks的批处理脚本 这个来自spiceworks的HTA VBscript ManagePC 这些方法都不能卸载有问题的软件。 我已经在我的本地机器上testing了这些方法与软件的对比,唯一真正获得卸载程序的方法就是HTA。 但是,我的计算机上没有安装任何不需要的软件来testingHTA卸载方法。 在有问题的电脑上试用它,给我反馈的是“软件正在被卸载”,但实际上它并没有被卸载。 问题 :没有办法每台个人电脑都卸载有问题的软件,使用什么方法或程序可以远程卸载域工作站上不需要的软件?
我正在玩SQL Server代理警报,希望能够在事务复制中断时发送一些可靠的错误通知。 为了testing它,我需要打破它。 我有一个可以中断的订阅,但是我不想花很多时间重新初始化和提交快照。 有没有一个简单的,可逆的方法来打破复制?
如果没有问题,我需要configurationNagios发送一个通知,说明一切顺利。 这种设置是存在还是有插件?