我的备份服务器上经常遇到以下问题。 我会试图解释这个问题,希望有人能够澄清为什么以及如何解决这个问题
我们有一台DELL r200服务器连接了easyRAID Q16R-S3R3 RAID磁盘arrays。 我们使用LSI SAS2008 PCI卡连接这两个组件(磁盘arrays和头节点)。 在EasyRAID中,我们安装了8个磁盘,并绑定到一个逻辑磁盘。
在R200上,我们有如下磁盘configuration:我们在R200服务器上创buildLVM,而不是在EASYRAID
PVS PV VG Fmt Attr PSize PFree / dev / sdc vg0 lvm2 a- 5.46t 1.03t
root @ backupserver:/ home / netsys#vgs VG #PV #LV #SN Attr VSize VFree vg0 1 9 0 wz - n - 5.46t 1.03t
root @ backupserver:/ home / netsys#lvs LV VG Attr LSize Origin Snap%Move Log Copy%Convert lv0vm vg0 -wi-ao 1000.00g lv0vm2 vg0 -wi-a- 100.00g lv1data vg0 -wi-ao 1000.00g lv1databackup vg0 -wi-ao 1000.00g lv1dataold20120903 vg0 -wi-a- 1000.00g lv2ceres vg0 -wi-ao 200.00g lv2ceresold20121022 vg0 -wi-a- 100.00g lv3iso vg0 -wi-ao 34.00g lv4svn vg0 -wi-ao 100.00g
每晚22点左右,我们在lv1databackup和lv1data(包含快照)之间运行Rsnapshot。 现在我们每次运行这个设置后都会在日志中出现以下错误
5月20日22:15:20 backupserver内核:[11777489.404269] EXT3-fs错误(device dm-8):ext3_lookup:被删除的inode引用:60891438 5月20日22:15:20 backupserver内核:[11777489.406210] EXT3-fs错误(设备dm-8):ext3_lookup:删除的inode参考:60891429 5月20日22:15:20 backupserver内核:[11777489.407835] EXT3-fs错误(device dm-8):ext3_lookup:被删除的inode引用:60891431 5月20日22:15:20 backupserver内核:[11777489.409474] EXT3-fs错误(device dm-8):ext3_lookup:被删除的inode参考:60891430 5月20日22:15:21 backupserver内核:[11777489.422835] EXT3-fs错误(设备dm-8):ext3_lookup:删除的inode参考:60891523 5月20日22:15:21 backupserver内核:[11777489.424514] EXT3-fs错误(device dm-8):ext3_lookup:被删除的inode参考:60891533 5月20日22:15:21 backupserver内核:[11777489.426153] EXT3-fs错误(device dm-8):ext3_lookup:被删除的inode引用:60891524
当运行e2fsck这些错误是固定的,但2或3天后,这些错误又回来了。 然后我们重新创buildLVM并重新开始。 现在这不是一个稳定的备份系统。
任何人都可以澄清为什么我们得到这些EXT3-F错误和我们的设置有什么问题?
低于额外的信息,可能有帮助
tnap2fs在rsnapshot的源文件上
root @ backupserver:/ home / netsys#tune2fs -l / dev / mapper / vg0-lv1databackup tune2fs 1.42(29-Nov-2011) 文件系统卷名称: 最后登上: 文件系统UUID:c150d0c9-cc31-41ab-85a5-3d63b79d0076 文件系统幻数:0xEF53 文件系统修订号:1(dynamic) 文件系统function:has_journal ext_attr resize_inode dir_index文件typesneeds_recovery sparse_super large_file 文件系统标志:signed_directory_hash 默认挂载选项:(无) 文件系统状态:干净 错误行为:继续 文件系统操作系统types:Linux Inode计数:65536000 阻止计数:262144000 保留块计数:0 免费街区:143705208 自由inodes:64168616 第一个块:0 块大小:4096 片段大小:4096 保留的GDT块:961 每组块数:32768 每组片段:32768 每组的Inode:8192 每个组的Inode块:512 RAID步幅:128 RAID条带宽度:128 Filesystem created:Thu Sep 6 13:03:04 2012 最后登陆时间:2013年1月4日星期五17:49:01 上次写入时间:2013年1月4日星期五17:49:01 山计数:6 最大安装数量:27 上次检查:2012年12月12日星期三15:03:33 检查间隔时间:15552000(6个月) 下一次检查:2013年6月10日星期一16:03:33 保留块uid:0(用户root) 保留块gid:0(组根) 第一个inode:11 Inode大小:256 要求额外的尺寸:28 期望的额外收益:28 Journal inode:8 默认目录hash:half_md4 目录哈希种子:911d0866-e924-4069-8ce5-c945fbb6ee27 日记备份:inode块
Tune2fs -l在rsnapshot卷上
root @ backupserver:/ home / netsys#tune2fs -l / dev / mapper / vg0-lv1data tune2fs 1.42(29-Nov-2011) 文件系统卷名称: 最后登上: 文件系统UUID:c91740f4-17df-4518-9ef1-ba36b7820870 文件系统幻数:0xEF53 文件系统修订号:1(dynamic) 文件系统function:has_journal ext_attr resize_inode dir_index文件typesneeds_recovery sparse_super large_file 文件系统标志:signed_directory_hash 默认挂载选项:(无) 文件系统状态:清除错误 错误行为:继续 文件系统操作系统types:Linux Inode计数:65536000 阻止计数:262144000 保留块计数:0 免费街区:127616425 自由inodes:63661979 第一个块:0 块大小:4096 片段大小:4096 保留的GDT块:961 每组块数:32768 每组片段:32768 每组的Inode:8192 每个组的Inode块:512 RAID步幅:128 RAID条带宽度:128 创build的文件系统:Tue Sep 4 14:20:00 2012 最后登陆时间:Mon Apr 29 16:49:09 2013 上次写入时间:2013年5月21日星期二06:52:48 山计数:1 最大安装数:23 上次检查:2013年4月29日星期一10:18:08 检查间隔时间:15552000(6个月) 下次检查后:2013年10月26日星期六10:18:08 保留块uid:0(用户root) 保留块gid:0(组根) 第一个inode:11 Inode大小:256 要求额外的尺寸:28 期望的额外收益:28 Journal inode:8 默认目录hash:half_md4 目录哈希种子:74faab9b-739f-47dd-ba48-059e5b06829a 日记备份:inode块
rsnapshot卷上的inode使用情况
root @ backupserver:/ home / netsys#df -i / mnt / lv1data / 已安装IFree IUse%的文件系统Inode / dev / mapper / vg0-lv1data 65536000 1874021 63661979 3%/ mnt / lv1data
LSI SAS2008驱动程序中的modinfo
root @ backupserver:/ home / netsys #modinfo mpt2sas filename:/lib/modules/3.2.0-23-generic/kernel/drivers/scsi/mpt2sas/mpt2sas.ko 版本:10.100.00.00 许可证:GPL 说明:LSI MPT Fusion SAS 2.0设备驱动程序 作者:LSI公司 srcversion:C1D4E89BF318C53971B5113 别名:pci:v00001000d0000007Esv * sd * bc * sc * i * 别名:pci:v00001000d0000006Esv * sd * bc * sc * i * 别名:pci:v00001000d00000087sv * sd * bc * sc * i * 别名:pci:v00001000d00000086sv * sd * bc * sc * i * 别名:pci:v00001000d00000085sv * sd * bc * sc * i * 别名:pci:v00001000d00000084sv * sd * bc * sc * i * 别名:pci:v00001000d00000083sv * sd * bc * sc * i * 别名:pci:v00001000d00000082sv * sd * bc * sc * i * 别名:pci:v00001000d00000081sv * sd * bc * sc * i * 别名:pci:v00001000d00000080sv * sd * bc * sc * i * 别名:pci:v00001000d00000065sv * sd * bc * sc * i * 别名:pci:v00001000d00000064sv * sd * bc * sc * i * 别名:pci:v00001000d00000077sv * sd * bc * sc * i * 别名:pci:v00001000d00000076sv * sd * bc * sc * i * 别名:pci:v00001000d00000074sv * sd * bc * sc * i * 别名:pci:v00001000d00000072sv * sd * bc * sc * i * 别名:pci:v00001000d00000070sv * sd * bc * sc * i * 取决于:scsi_transport_sas,raid_class intree:Y vermagic:3.2.0-23-通用SMP mod_unload modversions parm:logging_level:启用其他日志信息的位(默认值= 0) parm:max_sectors:最大扇区,范围64到8192默认值= 8192(ushort) parm:max_lun:max lun,default = 16895(int) parm:max_queue_depth:最大控制器队列深度(int) parm:max_sgl_entries:max sg entries(int) parm:msix_disable:禁用msix路由中断(默认= 0)(int) parm:missing_delay:设备缺less延迟,io缺失延迟(int数组) parm:mpt2sas_fwfault_debug:启用固件故障检测并暂停固件 - (默认值= 0) parm:disable_discovery:禁用发现(int) parm:diag_buffer_enable:post diag buffers(TRACE = 1 / SNAPSHOT = 2 / EXTENDED = 4 / default = 0)(int)
内核版本
root @ backupserver:/ home / netsys#uname -a Linux备份服务器3.2.0-23-generic#36-Ubuntu SMP Tue Apr 10 20:39:51 UTC 2012 x86_64 x86_64 x86_64 GNU / Linux
版
root @ backupserver:/ home / netsys#cat / etc / issue Ubuntu 12.04 LTS \ n \ l
我们不使用多path…
亲切的问候
沃特