我首先解释一下为什么我要这样做。 一切运行良好。 我在另一台服务器上导入了一个MySQL数据库的快照,以便设置master-master复制(一旦它被设置,它将成为数组中的主数据库)。 我已经把MySQL从属复制,并赶上。 我也通过cygwin进行了rsync传输。 我忘记了一些东西,于是我向MySQL发出了一个STOP SLAVE命令。 这导致整个服务器从字面上挂起。 没有答复在平,什么都没有。 在此状态下约15分钟后,手动重新启动盒子。
如果我可以信任服务器,这就提出了我的问题。 STOP SLAVE根本不是一个密集的电话。 这超出了我为什么会导致MySQL崩溃,而不是整个操作系统。 所以现在我想知道这是否是一个硬件问题。 我们刚刚在服务器上安装了全新的Ram(32GB),但是它们从来没有运行memtest。 由于我没有物理访问服务器(在不同的国家),他们将不会运行memtest,直到星期一上午。 我想尽可能在周末做很多testing。
几年前,我在Linux上遇到了一个类似的问题,这是由于错误的BIOS引起的,在I / O负载过高的情况下,这个盒子会冻结。 然后,我所做的重现它有几个Python脚本生成一些大(10GB +)文件,然后随机寻find这些文件中的不同位置。 这导致机器在几分钟内停止。
所以这让我想到,为什么不做类似的事情。 所以我写了一个python程序来读写一系列文件(运行在4个进程中),希望能使磁盘饱和。 然后,我写了另一个尝试尽可能地吃尽可能多的内存(现在是32GB和攀登),同时随机阅读和写入列表中的位置。 现在已经开始了大约一个小时,并且仍然稳定(交换正在放慢速度,但仍然稳定)。
所以我来这里问,是否有任何压力testing2k8的用户土地方式是不是真正的应用程序依赖? 一旦MySQL赶上,我会写一个脚本随机查询,以增加I / O和内存的锻炼。 但是我更希望testing机器和操作系统,而不是应用程序……但是在那之前,我想惩罚这台机器。
谢谢
为了testing硬盘驱动器,您可以多次运行驱动器制造商提供的全面扫描。
为了testingCPU和内存,这里有不less软件包。 “老化”testing很可能是您正在寻找的东西,但是大多数基准testing套件可能会让计算机变得紧张。 我是SiSoft Sandra软件包的粉丝,尽pipe我已经有好几年没用过了。
如果您正在寻找更接近Python脚本的东西,请尝试IOZone
我可能会在这里说明这个问题,但是您是否检查了服务器上的事件日志,看看是否可以帮助确定导致崩溃的原因?
我不确定它是否是我的一个误导迷信,因为我没有图表来certificate它,但我注意到,大部分时间,我看到一个服务器的问题是一个软件/操作系统相关的错误。