带有SAN和Oracle 11g的HP Windows 2008 Server中的高磁盘IO峰值

我有一个HP Proliant BL68C G5服务器,运行Windows Server 2008 R2标准版服务器,用作Oracle 11g数据服务器。

该机器本身具有20GB内存,双Xeon 2.4ghz CPU,Smart Array P400i上的146gb SAS驱动器(Raid 1 + 0)作为操作驱动器,HP Eva FC SANarrays用于Oracle文件。

我检查了FC HBA和SAN控制器的固件更新,确保Windows是最新的,而且我使用的是最新的惠普驱动程序。

但是,Oracle数据库的性能有所下降,一位Oracle顾问看了看Oracle的安装情况,并build议说他们是磁盘子系统的问题。

在一个典型的忙碌会议中,我跑了15分钟,我得到了下面的数字。

%磁盘时间:平均:61最大:15,145

平均。 磁盘读取队列长度:平均:1.043最大值:8.755

平均。 磁盘写入队列长度:平均:1.911最大值:756.456

%处理器时间:平均:2.529最大:23.655

平均。 磁盘秒/读:平均:0.013最大:0.041

平均。 磁盘秒/写入:平均:0.008最大值:0.153

内存可用By:avg:1.0780e + 010最大:1.0796e + 010

从我的理解,平均数字是好的,但最高的数字是非常高的。 我也明白磁盘时间并不是使用SANarrays时最好的数字,但最大队列长度让我担心,这与Oracle所说的磁盘访问速度缓慢有关。

我考虑过networking访问,同期看来最多有75MB的stream量,考虑到networking使用千兆位以太网,这似乎并不是很多。

有没有人遇到过类似的情况,或有任何指示我可以进一步调查。

机器的性能对我来说似乎非常好,但被locking在与甲骨文的战斗中,以certificate他们的软件导致了磁盘问题,而不是SAN本身,这是相当令人沮丧的。

我试图全面地描述我的描述,但是如果有人有任何的build议和需要更多的信息,请不要犹豫,问。

平均。 磁盘秒/读:平均:0.013最大:0.041

平均。 磁盘秒/写入:平均:0.008最大值:0.153

我看到的唯一相关的柜台。 真。 排队lentsh是很难判断。

对于高端市场来说,平均水平和高水平都是很高的。 看起来像IO瓶颈或configuration问题的地方。

机器的性能对我来说似乎非常好,但被locking在与甲骨文的战斗中,以certificate他们的软件导致了磁盘问题,而不是SAN本身,这是相当令人沮丧的。

主要是因为它是SAN。 这是慢的。 对于像我这样的中档DAS系统(Velociraptors,没有SAS光盘),这个数字会太高,对于一个真正的SAN来说,他们确实真的很高。

但最大队列长度让我担心,它与Oracle所说的磁盘访问速度缓慢有关。

现在,这是棘手的事情。 队列长度的解释取决于许多因素,这并非没有必要说的。 756k磁盘队列长度意味着oracle在SAN上转储很多东西,而SAN不回答。 清楚地表明瓶颈。 但是数字是什么意思?

另一方面,秒/写从0.008吨.153秒。 0.153真的很慢。 0.008不是很快开始(假设一个真正的SAN)。

绝对不是Oracle的问题 – 你的光盘子系统是瓶颈。

由于这看起来像一个Windows盒子,您可能会从Perfmon中获得更好的指标。 将平均队列长度与“Average Disk Transfer / sec”结合起来。 这两个应该让你更好地了解你似乎看到的存储瓶颈。 如果在磁盘传输同时激增的情况下队列长度急剧上升,那么这是一个非常明显的迹象,表明您的SAN不能满足需求。

另一件要注意的是性能随时间的推移。 如果这个756平均队列长度已经到位了4秒,那么这是一个单一的爆发,并且比每隔15秒左右看到它接近这些水平更不重要。

无论如何,这听起来像是你已经在推动你的存储极限了。