我在Ubuntu的LVM上有一个软件RAID 5分区(实际上,桌面,但我用它作为服务器)。 我一直在向它收集大量的数据,而且电脑很难冻结,因为我需要按“重置”。
所以我认为这是rsync。 但是我决定尝试一下dd if = / dev / zero of = / path / to / raid5,果然,计算机被locking了。 与同一台机器上的JBOD分区有相同的dd,并没有崩溃。
假设一个干净的RAID5分区,三核处理器2GB RAM,6GB交换,可能是什么原因造成的?
编辑:我排除了记忆; 我跑了8小时memtest没有崩溃。
04/26/2011编辑:我已经排除了Ubuntu孤独; 在Debian 6稳定中发生错误。 这是硬件或上游的错误。
是的,testing你的RAM。 尝试更重的testing纯IO。 除此之外,尝试获得可重复的scheme并在launchpad.net上打开一个错误
假设你通过LVM使用软件RAID5(你没有说R5是什么提供的),这可能是一个内核错误的迹象。 R5需要奇偶校验计算,这会消耗CPU资源。 如果这一点足够高,内核可能会遇到一些无法解决的争用问题。 虽然这只是一个猜测。
RAIDarrays中的所有东西(包括/等等)还是单独的? 如果分开,你能看到日志中的任何东西就在硬挂之前? 另外,您能否确认这是一个完整的挂起 – 您是否可以通过networkingping机器等等?
写入到JBODarrays和RAID5arrays之间的区别在于,在RAID5的情况下驱动器被更均匀地访问并且将使用更多的CPU时间(用于奇偶性计算)。 如果其中一个驱动器出现问题,我希望它会从arrays中掉下来,而不是挂在机器上,除非问题是驱动器控制器翻倒并将机器的I / O控制器拿下。 我在这里要做的第一件事是进行全面的内存testing,并确保CPU散热正常运行(RAID5的奇偶校验计算不会对现代CPU本身造成任何重大负载,但可能会造成影响边缘如果已经接近麻烦了)。