RAID 服务器 Gind.cn

XFS检查/修复失败

我在一个EC2实例上有一个MySQL数据库服务器，在RAID 0arrays中有3个驱动器。今天早上，服务器崩溃，检查日志后，我注意到一个结构需要清理错误（即系统错误代码117）。与此我试图在受影响的驱动器上运行xfs_check，但以下是返回的： xfs_repair: /dev/md0 contains a mounted filesystem fatal error — couldn't initialize XFS library 我有所有必要的工具/软件包安装，所以我检查了系统日志，它返回这个： Filesystem "md0": XFS internal error xfs_da_do_buf(2) at line 2112 of file /build/buildd/linux-ec2-2.6.32/fs/xfs/xfs_da_btree.c. Caller 0xffffffff81261bb5 尝试一个xfs_repair后，我仍然可以看到与上面相同的输出和相同的syslog条目。由于问题只在一个数据库目录中，是否有办法解决所提及的问题或让mysql忽略数据库目录以便继续操作（即手动删除数据库，同时保持lib目录不变）。任何的意见都将会有帮助。

奇数mdadm输出：–examine显示arrays状态失败，–detail显示一切干净

设置：mdadmpipe理的RAID5arrays中的8个磁盘（/ dev / md0，由/ dev / sdc通过/ dev / sdj创build）。一个磁盘（/ dev / sdh）显示SMART错误（增加待定扇区数），所以我正在寻找replace它。另外，机器从configuration有RAID0条带的PCIe插槽中的Revodrive SSD进行引导。奇怪：mdadm –detail输出显示数组为干净的，一切看起来运行良好（我可以挂载，读取，写入数组没有问题）。 mdadm – 显示每个磁盘的输出显示失败的数组状态。 root@saturn:/backup# cat /proc/mdstat Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : active raid5 sdi1[6] sdj1[8] sdh1[5] sdg1[4] sdf1[3] sde1[2] sdd1[1] sdc1[0] 20511854272 blocks super 1.0 level 5, 64k chunk, algorithm […]

无响应的mdadm

我有一个raid 5 mdadm RAIDarrays设置了6个驱动器和一个Ubuntu 11服务器上的热备份。车上有几个桑巴股票，直到今天，他们工作的很好。几个小时前，用户开始注意到他们的共享正在爬行或者根本不连接，花了许多分钟来列出当前的文件。试图复制文件会冻结大部分时间的连接，并最终断开连接。我能够通过ssh浏览挂载的目录上的共享，但是samba肯定有问题。我尝试重新启动桑巴没有任何效果。我跑了mdadm –detail / dev / md2和…什么也没有。它没有输出任何东西或返回我的提示，我不得不控制它来让我的提示回来。 / proc / mdstat也是空的。但由于某种原因，我仍然可以浏览装载的RAIDarrays，一切都很好。回想起来，我应该尝试通过terminal添加和删除文件… 检查进程监视器显示每个挂在D状态的用户的一堆smbd进程，我不能用kill命令来阻止它们。我没有看到像这样的东西，而mdadm没有提供任何有用的信息，我尝试重新启动服务器。那也挂了。我越过我的手指，告诉数据中心的人打硬重置。最后，袭击正在重build，所有的驱动器都起来了。但是我仍然不确定会导致mdadm如何冻结，断开所有的samba连接，并且没有响应。我对这一切都很陌生，所以希望得到一些帮助，从那些以前可能见过类似问题的人那里debugging问题。你先看哪里？编辑::以下ACASE的build议，这里是一些更多的诊断信息： / dev / md2（有问题的RAID驱动器）上的文件系统是ext3 这是我的内核信息 2.6.35-22-server #33-Ubuntu SMP Sun Sep 19 20:48:58 UTC 2010 x86_64 GNU/Linux 查看/ var / log / messages显示在重新启动之前，我在这个时间段内通过samba无法访问驱动器时遇到了一堆这样的错误（每3秒钟可能有15次）： kernel: […]

在进行高风险的卸载之前，请将一个raid 1磁盘作为后备？

我必须处理一个多年来一直没有被照顾的Windows 2003 std服务器。它有一个旧的，不支持的McAfee反病毒企业版本安装，它是间歇性的疯了，接pipeCPU。我需要卸载它。迈克菲将软件视为生命的终结，而不是作为一种资源。我担心的是，当我卸载反病毒软件时，它可能会弄得一团糟，并可能导致一台服务器，无法启动或该命令的东西。有从服务器的ntbackup备份，但没有办法testing恢复的短，只是这样做。服务器是具有硬件raid 1（两个镜像磁盘）的IBM eServer xSeries 226。我想知道如果这个卸载事件的一个相当安全的方法是卸载之前删除一个磁盘，如果一切成功，请重新引入磁盘。另一方面，如果卸载导致服务器损坏，我可以删除参与卸载的磁盘，然后从卸载之前拔出的磁盘启动。这是一个合理的方法吗？我从来没有从这个盒子里拉出一个磁盘，所以我不知道在上面的场景中我将重新引入第二个磁盘的时候会做什么。我想在启动时会出现一个屏幕，询问它应该“去”哪个磁盘？它使用Adaptec AIC-7902B HostRAID和Adaptec AIC-7902B Ultra320 SCSI。我不是一个突袭专家，所以我不知道我上面提出的问题是完全荒谬的还是合理的。谢谢你的帮助！

奇怪的“DF”输出+破碎的/ etc / mtab

我刚刚在一台装有LSI硬件RAID 5的服务器机器上安装Arch Linux。在安装过程中，我创build了（和cfdisk正确报告）三个分区： sda1 (/, 131G) sda2 (/boot, 1G) sda5 (swap, 4G) 一切似乎工作正常，除了df命令显示奇怪的输出： Filesystem 1K-blocks Used Available Use% Mounted on tmpfs 131G 2.8G 121G 3% /tmp /dev/sda2 955M 50M 860M 6% /boot 请注意，在这一点上，/ dev / sda2实际上没有安装…但是，/ dev / sda1（我的根分区）丢失，虽然它是明确安装。如果标记为“/ dev / sda1”，则tmpfs的读数是正确的。同样，mount命令（和/ etc / mtab）显示： tmpfs on /tmp type tmpfs (rw,nosuid,nodev) /dev/sda2 […]

3盘软件RAID1E的Ext3步幅/条带宽度计算

由于太复杂的原因，我在某些Linux系统上使用了3磁盘RAID1E。在这里看到更多的信息。所以我的理解是，为了优化这个卷上的文件系统布局，你使用下面的计算： chunk-size = 64kB block-size = 4kB stride = chunk / block = 16 stripe-width = stride * ( (numdisks)/2 ) = 16 * 1.5 = 24 但是，当我使用该计算来设置条带宽度时，mkfs.ext3会给出警告，它应该是2的幂。所以我的问题是，我做对了吗？我应该把它看作是一个标准的四磁盘RAID10，因为条纹的大小是一样的吗？更新：它不是一个降级arrays，它是一个完全支持的configuration。阅读第一段的链接。

mdadm内核日志消息的解释

欢迎。我试图恢复从Linux软件突袭故障。我正在重build基于系统日志的超级块，当它是健康的。日志讲述了大约2个md设备，每个设备基于5个500GB分区。 RAID-5 / dev / md5由/ dev / sd [bf] 6组成，而RAID-6 / dev / md6由/ dev / sd [bf] 5组成。相关部分dmesg日志如下所示： [ 5.964928] raid5: allocated 5265kB for md5 [ 5.979771] 4: w=1 pa=0 pr=5 m=1 a=2 r=5 op1=0 op2=0 [ 5.987064] 1: w=2 pa=0 pr=5 m=1 a=2 r=5 op1=0 op2=0 [ 5.994256] […]

将RAID 10移动到Smart Array 6i控制器上的另一台相同的服务器上

我已经死了HP DL 380G4与RAID 1 + 0与从内置的智能arrays6i 128Mb BBWC 4x72GB驱动器1逻辑卷。它正常closures。国际劳工组织领导的2,3,8照明似乎是Proliant的平常死亡。我想移动arrays到另一个相同的服务器与相同的RAID固件级别。什么是最好的策略？：我在托架0托架1托架2托架3上有RAID 1 + 0 据我所知，bay0 + bay1在RAID 1中，bay2 + bay3在RAID 1中，两个RAID 1都在RAID 0中。所以我应该：在新服务器上清除RAIDconfiguration，插入托架0，托架2并打开电源要么从清空的硬盘驱动器创build带有1个逻辑卷的RAID 1 + 0，然后closures硬盘，从旧的RAID 1 + 0插入2个硬盘驱动器（托架0，托架2）。然后开机。（每个硬盘都有其存储的raid位置信息，但可能可以在同一个configuration上工作）根据Smart Array 6i的文档，可以迁移。但是对于我来说一个要求点还不清楚 Before you move drives, the following conditions must be met: • The array is […]

智能arraysP400i物理驱动器更换后失败

我们在几个HP系统（ProLiant DL360 G5）中更换了坏的硬盘，但是它们仍然显示失败。驱动器是RAID的一部分，我想这可能是他们出现失败的原因。固件/型号不一样，尽pipe它们都是HP驱动器。这就是为什么他们会保持失败的状态吗？他们是新的驱动器，所以我不认为他们已经坏了。

RAID 5驱动器升级

我们有一台HP ProLiant ML350 G5服务器，在Smart Array E200i控制器上configuration了一个8槽位RAID 5arrays。系统卷和数据位于同一个逻辑驱动器上。驱动器每个都是72GB，而且空间不足。所有的海湾都用完了。在升级arrays时，我们考虑了外部存储扩展，并使用归档驱动来暂时移动数据，但考虑到它是系统驱动器，这可能会变得棘手。我们想出了这个计划，想要validation一下这个工作： validation完整的数据备份已完成。从托架1-4中取出72gb的驱动器，打破arrays。将新驱动器放入托架1-4（600GB驱动器）。我们完全意识到，将这些驱动器添加到现有的arrays将不会利用所有的空间。让arrays重build。从托架5-8中取出驱动器，再次断开arrays。现在，所有的数据也都在前4个600GB驱动器上，所以我们可以将arrays扩展到全尺寸，并从逻辑驱动器中移除最后4个驱动器。我主要不确定的部分是如何从逻辑上删除arrays中的最后4个驱动器，以及这是否可以工作。感谢您的任何见解。更新：由于我不能标记评论作为答案，我会更新post。最后，我们除了备份所有数据，更换驱动器，重新创buildarrays和恢复之外没有别的办法。当你不经常这样做的时候，这是相当不好的，所以我们把testing计划放在一起，使用Macrium服务器备份到USB3驱动器，并在新的驱动器到位后进行恢复。在更换驱动器之前，我们确保我们可以访问所有的备份，并制定了一个计划B.花了一段时间，但它确实工作，现在他们有足够的空间可用。谢谢。

Intereting Posts

freeradius不接受login 从EC2实例自动发现RDS端点高磁盘I / O – jbd2 / sda2-8进程有谁知道如何使用TeamCity的Bazaar仓库？ Apache不使用SWAP，报告页面分配失败重新启动nginx后端而不会丢失请求在SQL Server上configuration用户login和存储过程权限在Mikrotik路由器上loggingNAT映射 del * .txt也删除file.txt_backup Windows Server 2012在启动时运行服务失败从网页创build插件域您如何为网站进行负载testing和容量规划？ RAID6以相对较低的TPS产生相当的IO等待 CentOS 5.8为什么我的/ etc / hosts文件在重新启动后搞砸了？失败的握手。不包含任何IP SAN

Articles of RAID