NAS设备到1Gb / sec连接的100个工作站的最大理论吞吐量是多less?

这是一个难以问的问题,因为它取决于一些假设。 但假设我们有100个工作站需要连接到networking连接的存储设备。 如果每个NAS有1Gb /秒的连接,那么NAS可以提供​​给这些工作站的最大吞吐量是多less? 我正在尝试devise一个NAS,用于安装100台工作站和一些科学设备(比如相当于20台工作站)。 供应商说:“你告诉我你需要什么。” 我需要将100个工作站连接到一些将主目录提供给工作站的系统,还有几台服务器将运行虚拟机,以用于许可证和Web服务器等应用程序 – 但让我们专注于NAS设备可能交付的内容,给出1 Gb /秒连接。 如果NAS提供20GB /秒,那么我想最多有20个工作站随时都会以最大速率传输文件。

相关的问题是在科学计算环境中,工作站的典型文件I / O需求是什么?

你需要一些数据收集。 这基本上可以采取我能想到的四种forms。 他们的组合可能是最好的,但单独我把他们从我认为是最坏的到最好的。

  1. 询问供应商(或一组供应商)并根据他们告诉你的内容。 他们都应该有计算器来猜测这种负载。 他们甚至可以借给你一个SAN来尝试一下(但是你可能不得不花费大量的资金来完成这个任务)。 这与在服务器故障中询问这里类似,但是供应商应该拥有比从我们的几个用户那里得到的更重要的样本集。
  2. 信封的背面:找出人们在您的环境中使用其主目录中的文件执行什么样的任务。 他们是否加载大数据集,电子表格,实际加载存储在他们的主目录中的程序? 在此基础上,为典型的计算机提出一个假想的概况(他们加载的数据量,假设它是突发性的,乘以计算机的数量,并在工作日中使用像泊松分布这样的数据) 。
  3. 从一些人民工作站收集一些样本数据全天。 这取决于操作系统,但是您可以在Linux环境中使用sar工具,在Windows环境中使用Perfmon。 然后采取这个configuration文件,并采用上述类似的方法外推。
  4. 收集所有工作站的数据。 这当然是最好的。

存储性能并不总是与吞吐量有关

所以到现实…

今天,我可能会为您将双键10GbE连接到一对交叉堆叠交换机(或机箱交换机)的客户机构build一个NAS解决scheme。 这不像你有很多select…

NAS --- 2 x 10GbE ---> switch --- 1GbE ---> computing workstations

这是基于以下因素:

  • NAS环境中通常可用的function(在商业解决scheme中,您通常不会看到大于1 x 10GbE的任何内容)
  • 对于大多数组织而言,实惠(10GbE端口在当今交换机产品中是常见的)
  • 将会有一定量的超额认购。 (需要针对最坏情况下的大小)
  • 你不是在运行10GbE的工作站。

在NAS层面,您应该关心:

  • 典型数据工作集的大小。
  • 存储IOPS在后端需要。
  • 容量和增长空间。
  • 分层/caching。
  • 弹性(RAID等)
  • 备份。