如何使用Nagios监控Citrix XenApp?

我从来没有能够find任何好的在线监测思杰XenApp客户端桌面。

通常,停止显示的问题只有在用户login并尝试启动应用程序后才会显示。

它很less帮助监视Windows服务正在启动,有时甚至已经locking,并显示为启动,但仍然需要重新启动。

那么社区如何解决Citrix XenApp客户端桌面的监控? 你如何确保最终用户可以login和启动他们的应用程序?

我在serverfault上发现了一些有关Citrix EdgeSight的内容,只要在用户会话启动失败时提醒我们,我就不会反对Nagios以外的解决scheme。

只做“活着”的服务器,服务等检查,对我的经验没有什么好处。

性能不佳的XenApp服务器可能几乎与一个完全无法使用的服务器一样糟糕 – 无论哪种情况,用户都无法提高生产力,而且您的服务台中充斥着呼叫。

我在我的雇主使用EdgeSight,这是专为监控XenApp而量身打造的,但它已经显示了它的年龄,并没有看到升级,更不用说重要的升级了(发展早已停止,EdgeSight现在合并到XenDesktop的)。

除了我的头顶上的几个select,我打算看看自己(顺便说一下,不隶属于这些):

  • Smart-X ControlUp
  • Splunk + uberAgent for Splunk (后者由Helge Klein编写)
  • eG Citrix显示器

现在,对于使用Nagios进行监控,我认为它可以从Windows节点获得性能指标? 我会特别注意这些性能指标(不是详尽的列表):

  • CPU使用百分比 (短峰通常是正常的,在〜95 +%时超过几秒,或在〜80 +%时30秒通常表示问题)
  • CPU中断时间 (驱动程序问题可能会导致CPU电源被中断所占用,因此不适用于应用程序)
  • 上下文切换/秒 (高级别的上下文切换,表示处理工作负载的逻辑CPU核心太less)
  • 可用RAM (内存不足导致过度的分页,这反过来损害用户的性能)
  • 磁盘繁忙时间 (不断繁忙的磁盘表示磁盘瓶颈)
  • 磁盘读/写延迟(高磁盘延迟会立即损害用户体验。磁盘/ RAID控制器/ SAN是否可以提供足够的I / O?)
  • 磁盘空闲空间 (没有磁盘空间,没有工作空间,没有生产力)
  • 活动的XenApp会话 (通常你可以定义最大会话数量的经验法则,你可以很容易地把它放在服务器上,考虑在你的负载评估器中包含“用户数量”,所以接近这个限制的服务器不太可能得到新的用户会话)

从您的实时环境获取这些指标的一些性能历史logging,确定您的“红/黄/绿”值,然后设置警报。

最明显的检查是check_tcp到端口1494(标准ica端口),如果这不起作用,用户将无法login。

监视Web界面的端口8080(ica xml)也很有用。

哦,还有一个:监视商店前台的Web界面,如果失败,用户将无法login。

除了Natxo的好build议之外,不要忘记监视TCP 2598,而不是1494来使用会话可靠性应用程序。

还要监视场中所有服务器的活动会话数。 如果一台服务器停止接受新的login,则会看到其数量低于通常的数量和/或其他服务器当前的数量。

我不熟悉Nagios; 快速search不会显示实际执行login的综合事务。 但是,如果您可以find或写入一个,那么这将是黄金 – 实际上,login到应用程序是testingXenApp是否正常运行的最正确方法。