如何在获得传输/秒数据后确定IOPS需求?

假设我已经收集了2×24小时的每秒磁盘传输数据,即每15秒钟对数据进行瞬时采样。 如果我想要使用这些数据来提供存储,我可以/应该对样本进行哪些统计分析?

我应该只使用峰值(发生时间less于1%)? 我应该用户的意思/平均价值? 还是涉及平均数和偏差的公式?

你总是为高峰做出规划,除非这种工作负载能够承受大量IO的高延迟。 这就是为什么宽带技术如此受欢迎的原因之一 – 你可以把大量的工作负载和大小放在一起,用于聚合使用的高峰 – 不同的部分将在不同的时间达到峰值,所以你可以使用更便宜的磁盘来提供相同的容量。

宽条带假定这是在某种集中存储上。 如果它是本地的,当然你不能以这种方式来聚合工作量。

不幸的是,这个问题不容易回答。 首先,考虑你的需求。 你愿意/能够花多less钱? 你需要多less冗余? 你需要多less总存储空间? 你可以忍受多less延迟? 您希望系统能够持续多长时间(包括规模增长和iops),您的增长会有多less? 你有没有时间维护和修剪你的数据,以减小尺寸?

最接近我可以回答你的问题,是要注意的是,如果你不能在任何时候处理瞬时iops,你只会增加延迟。 如果延迟并不重要,那么根据您预计的平均iops增长购买存储空间并不是一个糟糕的开始。

注:冗余不是备份解决scheme,因此也要备份备份。 备份可以(应)与时间和空间的实时数据隔离。