如何测量磁盘速度和速度? 1500 GB的拷贝需要多长时间?

如何测量磁盘速度? 是读取Mbit还是Mbyte? 今天的平均水平是多less?这个行业的速度是多快?

比方说有人说需要花费很长时间来复制一个1500 GB的文件(比如说一个数据库文件),这个专业系统需要多长时间,如何计算硬盘的速度呢? ?

磁盘速度通常在;

  • 每分钟转数的转速(最低速度为4200rpm,然后是5400,7200,10k和15k–这不适用于SSD或闪存)。
  • 接口速度是电子设备可以尝试将数据发送到磁盘控制器的最快速度(从ATA的100MBps到SATA的150/300/600 Mbps,光纤通道的2/4/8/16 Gbps甚至到PCIe速度)基于闪存的存储,如FusionIO)。
  • 寻找时间只是开始读取或写入特定磁盘扇区所需的时间 – 磁盘的范围可以从3-15ms到SSD /闪存磁盘的一小部分。
  • 然后我们达到你可以预期的实际速度,有四个速度你应该关心; 顺序读取(读取非常大的数据块),顺序写入(相同但是写入),随机读取(从整个磁盘获取数据)和随机写入。 这些变化非常大,但是对于旋转磁盘,您可以预期从25MBps到150MBps的任何连续读取和写入,以及任何从3MBps到50Mps的任意读取和写入。 固态硬盘的顺序通常在200MBps的范围内,随机操作通常会稍微less一些。 FusionIO可以很容易地达到1GBps,但通常是小而昂贵的。

正如你所看到的,没有真正的平均水平,如果你想要买什么样的build议,请尽可能多的回复我们 – 这应该包括预算,应用types,数据集大小,用户群,硬件/操作系统加上你认为有用的东西。

至于你的1.5TB的拷贝,那么如果你这样做的话,对于一个USB 2连接的7200转SATA磁盘,你应该至less得到30MBps-40MBps左右,完整的1.5TB可能需要10个小时左右。 如果这是一个典型的专业DAS / SAN系统,我预计在100MBps的地区,这意味着大约需要3个小时。

希望这有助于哦,只是为了澄清,MB =兆字节,MB是兆比特。

这些计算涉及许多variables。 真实世界的磁盘系统有很多相互依赖关系。 就在一台电脑里:

  • 驱动器本身的实际额定速度(一般为5200,7200,10K,15K)
  • 正在使用的文件系统
  • 是否正在使用RAID系统
    • 如果是,RAID卡的性能
    • RAID的types
  • 正在使用的操作系统
  • 读取和写入操作具有完全不同的性能特征
  • 操作的读/写比率
  • 对于顺序操作,存储的碎片因素

正如你所看到的,磁盘本身的速度只是许多因素之一。 这是一个很大的因素,但仍然是其中之一。 如果这个1.5TB拷贝全部在同一个磁盘上,那么磁盘将有95%的可能性执行100%的随机读/写性能,这通常会导致最差的性能指标。 如果副本是从一个磁盘到另一个磁盘,并且数据是100%连续的,并且目标磁盘完全是空的,则该磁盘子系统可以实现最快的性能。 真实世界的performance将介于这两个极端之间。

如果您在两台独立的服务器之间进行复制,则涉及更多因素。

我有一个工作存储arrays,可以饱和3Gb(千兆比特)SAS通道时,做大量的连续操作。 如果我有6Gb的SAS,它可能会非常接近饱和。 对于随机I / O,这个特定的系统根据操作系统的不同而执行很不同的操作(例如,OpenSolaris的随机I / O最差,Linux XFS最好是3倍)。

有太多的变数来确定地回答这个问题。

1.5TB的数据需要多长时间取决于数据的types。 如果你有几个1GB的文件,可能只需要几个小时,但是如果你有一个半个1KB的文件,可能需要几天的时间。

这是因为在光盘上有两个竞争规格:吞吐量和平均访问时间。 传统的光盘吞吐量为100MB /秒,访问时间为10ms是相当普遍的。 如果您可以顺序传输数据,您可以获得100MB /秒。 但是,如果你需要跳到另一个地方需要10ms。 如果你正在stream媒体,你可能已经写了1MB的数据在跳转到另一个位置的时间。

创build一个文件可能需要几个search,所以制作一个1KB的文件可以“花费”几百MB的数据。

因此,在某些情况下,最好是通过类似rsync的方式在文件系统上复制块设备的原始光盘副本。 如果你有很多的文件,在一个文件系统中,比如50%或者更多的文件系统,你通常只需要通过“dd”来复制整个块设备就行了。 当然,在文件系统挂载时你不能这样做,所以这也有缺点。

固态硬盘可以帮助缓解这种情况,因为固态硬盘的存取时间大约快100倍,但根据预先擦除块的可用性,MLC固态硬盘存在复杂的存取问题。 SLC SSD可以提供帮助。

具有内置caching的RAID控制器可以帮助寻找,像flashcache内核模块可以让您通过SSDcaching块设备。

RAID系统可以允许多个并行search,有效地减less了平均访问时间,并且还提高了吞吐量。 但是,您的整体性能往往取决于涉及的文件数量。