Intereting Posts

CPU是如何进入空闲状态进入更深的C状态的？显示每个接口的IP和TCP统计信息（带接口的netstat -s） Postfix：只有当我还没有在收件人列表中时，我如何才能发送邮件给我自己？获取“您正在寻找的页面暂时不可用。请稍后再试” 在Snow Leopard Server上安装BugZilla：Perl安装问题尽pipe在每个目录中都要求“全部批准” 在存储文件中缺less绑定DN条目 – 同时初始化领域的数据库将SVN Repos移动到新服务器脚本转发为Outlook 2003 启用一个接口会中断另一个接口 klogd使用高CPU Telnet挂起vim 使用Powershell将项目添加到McAfee Enterprise中的访问保护 IP地址不断分配，已被使用 Google Cloud DNS – 将CNAME添加到其他域？

HP Proliant DL380 G6 – 在RAID 1重build期间发生第二个磁盘故障后恢复

**免责声明，我刚刚成为这个系统的pipe理员，并意识到备份是无法使用的。而且，pipe理软件的状态是可怕的**

系统（Ubuntu 14.04）在RAID 1（A和B）中运行两个146GB 10k SAS驱动器。这些机箱是热插拔的，所以服务器在这个过程中还在运行。

失败的驱动器A被驱动器C取代，闪烁的绿色状态确认arrays正在重build
以稳定的绿色状态（联机）回到C，但驱动器B稳定的琥珀色（脱机/严重故障）
但是，有很大一部分文件系统显然没有同步，由input/输出错误表示，文件系统恢复为只读

我的目标是确定驱动器B故障的来源，并且如果它很小（例如“不可读块错误”），则可以使用驱动器B重新启动系统，也可以强制重buildarrays，尽pipe存在错误。最主要的是确定如何让arrays控制器报告失败模式，并将故障驱动器视为好。

我只想恢复一些小的configuration文件，使重新安装时我的生活更轻松。

服务器当前处于有限状态，但是如果重新启动，肯定不会从驱动器C启动，因为部分/ bin /丢失了。令人惊讶的是它仍然在服务它的function，因为它只是经常使用dhcp和ssh。

我最终解决了这个问题，实际上我恢复了大部分的configuration。

当linux检测到故障并试图防止更多的损坏时，文件系统被挂载为只读。

重新启动系统到live CD，在raid提示下强制系统忽略[新]死的驱动器
安装HParraysconfiguration实用程序（HPACUCLI）来检查raid状态，安装驱动器并备份我可以的文件（〜24小时总计）
删除Live CD并重新启动，启动到原始的操作系统（实际上工作！）
在原始磁盘上运行fsck （很多/home/ data丢失，但这不是问题）
更换新的故障驱动器，build立一个适当的备份策略，这样不会再发生。