如何衡量复杂的I / O活动以开发切合实际的基准testing?

我需要从我的服务服务器检索一些度量标准来衡量另一个stroage解决scheme。 基准程序提供了各种选项(我selectFIO, http: //freecode.com/projects/fio)。 我可以很容易地设置它的io模式。 但我不知道如何才能真正服务的指标,尽可能现实地设置基准variables。

例如,我需要设置,

  • 随机/顺序读/写比率文件大小和分布的每个
  • 文件大小(如果我可能的话,每个大小的随机/顺序读/写比率)
  • iodepth
  • 随机访问的修订比率(可能影响随机访问性能)

我目前正在testingceph( http://ceph.com/ ),至less以上的指标似乎对我研究中的那些存储有重大影响。 我如何检索这些值?

collectcl( http://collectl.sourceforge.net/ )似乎是有保证的。 但是,除了读/写比率之外,还无法想象。 除了那些东西,我无法弄清楚。 我很想知道其他人如何决定这些基准variables。

提前致谢。

您可以使用blktrace来logging真实的系统存储活动并分析现有的工作负载。 这可以捕获到文件。

跟踪可以重播 。

另一个有趣的可能性可能是使用新的sysdig实用程序来尝试分析代表性工作负载下正在发生的事情。

另外,这里的一个答案显示了一个使用System Tap的有趣方法:
Linux实用程序loggingIO统计信息(随机/顺序,块大小,读/写比率)