将96 tb连接到工作站的最佳方法

我运行的是双xeon 5690(12个物理/ 24个逻辑核心),192 gb ram(即最大输出),Windows 7 64位,适配器卡5个插槽和1个内部存储器的工作站,其中5个更多的内部托架可用。

我有一个应用程序,创build数据文件总共约88磅。 这些是每14个月编写一次,其余时间只需要阅读应用程序; 并且> 95%的读取是大量数据的顺序读取。 我有一些控制单个文件有多大,但理想情况下,他们将在5至8TB之间。

该应用程序将一次只从一个驱动器读取,数据的性质是这样的,如果(何时)驱动器死亡,我可以从磁带恢复数据到一个新的磁盘。

虽然能够使用最快的驱动器/控制器将是很好的,但在这一点上,速度并不重要。

经过大量的阅读,我倾向于购买一堆便宜的2tb硬盘,并把它们放入一堆便宜的机箱中。 所有这些东西都将进入我的家庭办公室,所以我需要避免活动地板/冷藏方法。

我的问题:

  1. 便宜的驱动器/机箱解决scheme是否适合这种情况?

  2. 鉴于应用程序的性质和数据的使用方式,RAID是否有意义? 如果是这样,哪一个?

  3. 对于巨大的顺序读取,Usb 3.0和eSata是否能够在性能方面进行清洗?

  4. 对于工作站上的每个插槽,我可以连接一个可以容纳多个驱动器的机箱吗? 还是每个驱动器一个控制器?

  5. 如果我可以在一个控制器上有多个驱动器,我是否将带宽(吞吐量)分开? 例如,如果我有一个12托架shell,控制器的吞吐量是减less了12倍?

  6. 是否有任何Windows 7的音量/驱动器/容量限制,我应该知道的?

我会尽力回答,但是您所要求的一些内容更多的是关于个人偏好和软件的特性,而不是技术性的事实。

  1. 便宜的驱动器是…呃…便宜。 只有less数情况下,廉价驱动器比企业级驱动器“更好”。 对于廉价/消费级驱动器,您将无法获得企业级驱动器的性能,可靠性或支持,如果您的应用程序能够支持一年以上的驱动器故障,并且您可以在一个橱柜中安装less量备件只要坚持,当他们失败时,便宜的驱动器可能是最适合这种情况。 大多数消费者驱动器不是build立为全天候运行的,尽pipe大多数人可以很高兴地做到这一点。 如果性能是一个因素,那么您可能希望在性能,可靠性和成本之间达成妥协,查看一些较低端的服务器驱动器。

  2. 这是一个艰难的,因为你说你不需要可靠性,像RAID5 / 6/10可能没有意义。 如果你想在Windows中将整个arrays作为一个单一的磁盘寻址,你需要RAID0(Striped),然而这是它自己的问题,主要是如果arrays中的单个驱动器失败,整个arrays将是无用的*。 根据你的要求,我可能会build议RAID5。 这会降低写入性能,这可能是这样大的数据文件的问题,但是读取性能会相当好。 另外,根据您的应用程序,可以单独和独立地安装每个驱动器(以便在Windows资源pipe理器中显示为单独的驱动器),您的应用程序需要足够的智能以将正确的数据写入正确的驱动器,但是如果驱动器失败,你只会失去驱动器的数据。 这也意味着你只需要有足够的roof(total space needed/drive capacity)磁盘(如果你决定没有备用磁盘冗余)

  3. 这是更低的最高协议速度,不能记住他们的头顶,但他们应该很容易find。 但是,您更可能受到磁盘速度的限制,而不是电缆速度。

  4. 这些都是非常相似的问题,但它可能是值得研究Backblaze存储荚 (这是相关的问题 ),但是他们的串联SATA卡的设置可能是你在找什么,但我不知道如何内部的Windows会回应这个设置

  5. 往上看

  6. 据我所知,Windows 7的限制是250TB的东西,所以你不应该遇到任何问题,但你应该仔细检查这一点。

作为一个相关的问题,你为什么使用Windows 7? 这种工作量将会更适合Windows Server

*如果您有足够的备份,可以将正确的数据恢复到一个磁盘,但不能“popup一个新的磁盘,RAID将修复它”

-1)在这种情况下,便宜的驱动器/机箱解决scheme是否是最好的?

如果这是你所能负担得起的,那么它的一切你必须去,个人不,我不会相信它,因为他们可以做得更多,往往比你想要的。

0)鉴于应用程序的性质和数据的使用方式,RAID是否有意义? 如果是这样,哪一个?

是。 我认为你现实的看RAID 5 + 1或RAID 6.考虑到2TB硬盘的速率失败,你总是需要超过RAID 5。 请记住,重build时间将以驱动器运行的天数来衡量,并且在此期间的性能将是可怕的。

1)对于巨大的顺序读取,Usb 3.0和eSata是一个性能明智的清洗?

也许,这很难说。 USB 3.0是相当快,但没有尝试在RAID设置。 带有7个USBshell的USB 2.0虽然很差,但是我不知道这是否是USB 2.0的本质,或者是挂在USB上的本质。

3)如果我可以在一个控制器上有多个驱动器,我是否将带宽(吞吐量)分开? 例如,如果我有一个12托架shell,控制器的吞吐量是减less了12倍?

如果我理解你是正确的(你仍然指的是usb),那么是的,一个usb集线器将在每个端口上分配带宽,如果每个端口有多个驱动器,每个驱动器的速度就会降低,尽pipe只有usb3 .0 /驱动器数量小于一个驱动器的最大速度。

便宜的驱动器/机箱解决scheme是否适合这种情况?

定义便宜。 如果你的意思是每个箱子有5个以上的海湾,那么是的,这样可以很好地工作。

鉴于应用程序的性质和数据的使用方式,RAID是否有意义? 如果是这样,哪一个?

(A)是的。 (B)这取决于。 具体的RAID设置读取速度会更快,但在写入时会非常糟糕; 每个人都有独特的权衡。

对于巨大的顺序读取,Usb 3.0和eSata是否能够在性能方面进行清洗?

不要打扰USB 3,坚持使用eSATA。 USB看起来便宜,听起来很便宜,当你把它买到这个规模的时候 ,就会performance得很便宜。 USB争用会杀死你所做的任何收益, 特别是如果你selectRAID条带化你的数据 ,因为实际上有1个总线和N个主轴来往这个单一总线。 eSATA至less会限制在单个互连上运行多less个主轴; 给予4:1的SATA端口扩展器并不less见,这意味着竞争会less得多。

对于工作站上的每个插槽,我可以连接一个可以容纳多个驱动器的机箱吗? 还是每个驱动器一个控制器?

(A)是的。 (B)不,你不想那样,但是可以。

获取具有4个以上eSATA连接器的卡, 并在每个端口上支持SATA扩展器 。 将卡插入每个插槽,每个卡总共4个端口* 5个插槽*每个卡端口4个扩展器端口= 80个eSATA端口。 如果您使用1.5Tb(80 * 1.5 = 120Tb)或2Tb(80 * 2 = 160Tb)驱动器,应该可以解决这个问题。

当然,这种安排将有4 * 5 = 20驱动器托架。 如果你能find一个更密集的解决scheme,那对你有利。

如果我可以在一个控制器上有多个驱动器,我是否将带宽(吞吐量)分开? 例如,如果我有一个12托架shell,控制器的吞吐量是减less了12倍?

对于eSATA,一条带状电缆=一条总线,所以只有当所有驱动器同时连接一条电缆时才​​计数。 如果一次只使用一个,就没有争用,所以没有什么可担心的。 在RAID设置中,所有的驱动器淹没公共汽车,你沉没。 使用多卡/机箱/扩展器路由,可以最大限度地减less争用,因为每条物理电缆最多只能与4个驱动器进行竞争。

是否有任何Windows 7的音量/驱动器/容量限制,我应该知道的?

不知道,虽然看起来有人已经回答了。 (答案似乎是250TB)。