我正在使用Intel E3-1220v3 CPU的Dell PowerEdge R220服务器上运行ESXi 5.5(Build 2068190)。 它还具有16 GB的RAM,以及使用Dell PERC H310控制器作为RAID1运行的2个1 TB SATA磁盘。
这是问题。 几个小时前,我注意到其中一个客人在服务器上造成主要的CPU峰值。 整个主机冻结如此激烈的尖峰也影响到主机上的所有其他客人。 有问题的客人只有一个核心分配给它,并运行Debian 7 x64。
看看下面的附加图片。
图表左侧的滞后峰值每隔一分钟就会发生一次,持续大约一分钟。 在22:05和22:10之间的较长时间停止是当我closures客人,以确认这是造成CPU峰值。 在22:25会发生什么事情,我把访客CPU限制在2 GHz。 这阻止了尖峰发生,但现在整个服务器运行非常缓慢。 点击vSphere客户端时,大约需要5秒钟才能打开一个新窗口。
在这之前我做的唯一的事情是改变一个vSwitch的名字,我不知道这是不是真的造成了这个问题。 我也做了一些不同的客人作为其他客人运行vyos的网关的一些变化,但我不明白这是如何造成的。
不,因为属于客户,所以我不能接触到客人。 但是我知道它只运行apache2,mysql和mailman。
我的问题是:
a)任何人都知道是什么原因造成的,或者我可以做什么来找出是什么原因造成的?
b)我不认为一个客人会以这种方式影响整个主持人和其他客人,这是应该如何?
在此先感谢,让我知道如果你需要更多的信息。
编辑:挖掘后,我们发现客人的VPS已经被入侵,被用作黑客的FTP转储,这解释了激烈的交通(在几个小时350 GB)。 但是,这并不能解释为什么它会影响主机或其他客人。 我是否需要通过时钟频率来限制CPU性能,而不是仅仅为了避免有一个客户影响其他内核? 或者,它可能是不同的像vSwitches(反过来ESXi)在某种程度上超负荷工作?
编辑2:原来它不是一个FTP转储,而是他们让服务器参与某种ddos攻击。 后来我们的ISP给我们打电话说交通量已经影响了他们的其他服务/客户,所以我猜这是相当多的交通。