Articles of 重复数据删除

VMware ESXi 4磁盘上重复数据删除 – 可能和支持?

环境: 我们正在运行多个Web,数据库和应用程序服务器,这些服务器通常在VMware ESXi 4中共享相当常见的安装(gentoo linux)和类似的configuration。通常只有一些已安装的function或不同的组件版本。 要创build一个新的服务器,我通常select最相似的(通过function)运行的服务器,rsync的一个副本到新装的文件系统,运行grub,重新configuration和重新启动。 问题: 随着时间的推移,这会复制很多磁盘上的数据块,这些数据块可能总计高达几十个千兆字节。 我想如果我可以使用一个基本系统作为模板的基础上的实际机器,只有写改变块为某种“差异图像”,性能应该提高(caching命中率提高),存储效率应该增加(重复数据删除储存空间)。 这与ESXi已经支持RAM重复数据删除(页面共享)类似。 题: 有什么方法可以在ESXi 4上轻松完成此操作吗? 我已经通过NFS共享portage树,但这不适用于rootfs。

重复数据删除量的差异备份

我们目前正在每周进行一次虚拟机的完整远程备份。 这需要整个周末,如果可能的话,我想加快这个过程。 我们正在使用Dedup备份虚拟机,备份大小为300GB,使用128KB的块大小。 我们的小型办公室连接最多可以做10mbit的上游,这大概会转换为300GB的3天。 你觉得128kb对于这个应用程序来说太大了吗? 是否应该降低系统开销和较小的备份容量的成本? 我们是否可以通过带有Dedup的rsync进行差异备份,从而不需要完整的备份? 任何和所有的意见/build议是受欢迎的。 谢谢

从maildir中提取并保存附件,重复数据删除

我想知道是否存在一个解决scheme来归档电子邮件,删除附件,并单独保存,重复数据删除? 理想情况是maildir设置,脚本运行在消息上,提取附件,例如使用现有的/相同的附件的硬链接,留下一个链接/ URL保存在留言中的附件。 像这样的东西存在,作为脚本或任何可以在Linux服务器上运行? AFAIK Zimbra设置类似,有一个自定义的maildir +数据库支持的存储,但是,我希望有一些更“透明”的存档需求。

我应该为Solaris 11 Express使用USB驱动器吗?

讨论是否应该为我的Solaris 11 Express SAN服务器使用16 GB USB驱动器。 我打算使用重复数据删除,我相信可能是数据库的IO密集型。 虽然我不能确定。 SAN服务器预计将在多年内全天候运行。 我应该尽可能使用多个USB驱动器并镜像操作系统? 读/写速度是一个问题吗? 一些驱动器是10MB / s写入5MB / s读取。 有些是25MB / s的R / W。 我打算在以后为ZIL和L2ARC添加一些SSD。 以前有人build议我简单地将操作系统安装到服务器的存储驱动器上。 4x 300GB 15k SAS 6x 2TB 5400rpm SATA。 但是我不知道如何调整这些磁盘上的分区大小,如果让它们上的操作系统增加了一些复杂性,比如我决定通过提取磁盘和添加容量更大的磁盘来增加磁盘池的容量。

如何削减Windows 2012 Server以节省磁盘空间?

我有VPS主机Windows 2012 Server + MSSQL服务器40GB存储。 我的空间不足,我不想将主机升级到更昂贵的版本。 我已经清理日志,临时文件,回收站。 这还不够。 我用TreeSize分析了空间,我找不到更多的东西来删除。 尽pipe它的Windows文件夹有23 GB,我相信,像我不需要的语言拼写检查有很多镇stream器。 有什么大的我可以安全地从默认安装中删除?

18.1TB驱动器显示.75TB免费,但仅在Windows Server 2012 R2上扣除4.66TB

我有一个戴尔PE R520与18.1 TB驱动器(build立在RAID 6,磁盘内部到服务器)。 我在这个驱动器上安装了微软的重复数据删除function,并开始将大量的资料移到它上面。 现在可以看出,在18.1TB中已经有了0.75TB的存储空间, 但如果我拉起这个驱动器上的每个顶级文件夹的属性,它们显示24.47 TB作为未压缩的文件大小和4.66作为磁盘上的实际(重复)大小。 24.47TB是有意义的 – 因为它是在扣除更多的存储空间。 没有意义的是,为什么只有重复文件只消耗4.66TB,只有0.75TB可用。 我错过了什么?

IMAP服务器,节省相同的附件空间

寻找IMAP服务器,可以检测邮箱中的重复附件,不会浪费空间。 所以,如果4个本地邮箱收到相同的附件,我希望它只能在文件系统上存储一次。 开放源代码首选。 另外,为了解决上述问题,还有一些烦恼,因此对networking资源进行研究,对于优秀关键词的build议也非常受欢迎。 最好

ZFS:每个用户的encryption文件系统可以在块级重复数据删除吗?

假设我构build了一个存储系统,每个用户都可以在ZFS池的顶部获得他/她自己的encryption文件系统。 在每个fsencryption的情况下,池级别的重复数据删除是否仍然有效? 我有哪些encryption选项,哪些应该被青睐? 有没有人使用这样的设置,其中的用户空间是不透明的系统pipe理员?

Server 2012重复数据消除跳过副本VHD

我目前正在尝试在两台独立的Windows Server 2012 Datacenter版hyper-v主机上使用重复数据删除function。 一方面,我正在尝试去除每5分钟左右仍在重新同步的副本。 另一方面,我已经在大约15台服务器(4TB的数据)上停止了与powershell脚本的重新同步,并将它们移动到启用了重复数据删除的卷的根目录下。 现在出于某种原因,除了副本VHD映像之外,它可以与我放在其中的任何东西一起工作。 它只是跳过他们。 我放了50个模板和isos,演出效果很好,我开始重复数据删除,如下所示: Start-DedupeJob -Full -Path R: -Type Optimization 它通常很好,但我首先使用它的实际原因是为了减less存储副本VHD快照所需的空间。 我宁愿能够让hyper-v主机重新同步VHD,并有重复数据删除,但如果我必须删除同步,然后重复数据删除,然后unoptimize重新同步或与我很好,我可以编写脚本出来,但现在在任何情况下,我可以得到这些去重复副本vhds! 这让我疯狂! 任何意见,build议,将不胜感激。 更新: 我有两个VHD,一个来自模板,另一个来自另一个hyper-v服务器主机上的另一个虚拟机上的1.6TB数据驱动器的副本映像。 我已经匹配所有的文件属性和权限是相同的,包括所有权。 唯一的事情是,与去重有关的文件被标记为属性APL,而不是这样做的文件只是属性A – 我不知道P和L是什么,我不相信我可以用attrib 。可执行程序。 这么疯狂 – 没有副本的vhds将会重复这样的事情! 更新: 我用来优化vhds的脚本是 $vhds = Get-ChildItem -Recurse | ? {$_.extension -match "vhd"} foreach ($vhd in $vhds) { Mount-VHD -Path $vhd.fullname -Verbose -ReadOnly Optimize-VHD -path $vhd.fullname -Verbose -Mode […]

如何在Windows Server 2012中激活重复数据删除?

我刚刚安装了Windows Server 2012,在查看和了解新的重复数据删除function时,服务器pipe理器不断报告重复数据删除率和节省列中的空白字段。 如何让服务器开始寻找重复数据删除机会?