CPU还是磁盘瓶颈?

说我有机器A和B,其中机器B有一个适度的更快的磁盘,但与机器A相当的处理器,一切都是一样的。 我在input数据集太大而不适合内存的两台机器上本地执行大型的Spark作业,强制使用磁盘。 当我运行这个大的Spark作业时,我使用sysstat / sar收集系统度量标准。 这一点就是比较处理器。

机器B能够以大约10%的速度完成工作。 通过使用sar,我发现机器B能够实现每秒更高的扇区读/写(30%以上),平均I / O请求响应时间更less(高达250%)。 我得出这样的结论:机器B比机器A具有不公平的优势,因为它的速度更快。

我的问题是,如何能够确定机器B的处理器在使用磁盘I / 0时是否比机器A更有效? 更具体地说,如何确保磁盘速度的差异不会造成不公平的优势,以便在处理器之间进行公平的比较? 有没有任何系统指标可以提供更多的信息?