问题
我们在一个现有的平台上有一个性能问题,所以我现在正在转向蜂巢式的思想,对此有第二个意见。 性能问题到目前为止与IOPS而不是吞吐量有关。
情景
一个16个主机的刀片中心,每个都有64GB的RAM。 (这是一个戴尔M1000e瓦特/ M610s,但这可能不相关)500个虚拟机,所有的Web服务器(或相关的networking技术,如MySQL,负载平衡等),约90%是Linux和其余的Windows。 pipe理程序是VMWare vSphere。 我们需要提供主机HA,所以本地存储不在。 因此,主机只需要一张SD卡即可启动。
一点背景思考
目前我们最多有6台主机(刀片服务器中心将会在目前的增长时间内处于满负荷状态),而且我们正在运行iSCSI到戴尔MD3220i w / MD1220进行扩展。
我们考虑过的可能的select,以及与他们一起的直接想法:
问题
你会在下面运行什么样的存储? 它不需要扩展到另一个刀片中心,只需要为所有这些VM提供相对较好的性能。
我不是在寻找“购买SAN x,因为这是最好的”答案。 我正在寻找关于各种SAN技术(iSCSI,FC,FCoE,InfiniBand,NFS等),不同types的存储(SATA,SAS,SSD)以及处理100多个虚拟机的存储方法的思考(合并,分离,Sharding等)。
绝对的任何想法,链接,指南,指针等在这方面是值得欢迎的。 我也很想听听我们已经考虑过的上述选项的想法。
非常感谢任何input!
更新3月5日'12
迄今为止的一些精彩回应,非常感谢大家!
到目前为止,对这个问题的回答,我开始认为以下路线是:
这听起来似乎是值得使用主要SAN供应商的售前服务来获得他们的scheme。
我将继续考虑这个问题一段时间。 同时,更多的build议感激地收到!
一个好的VMWare存储平台的关键是了解VMWare产生的负载。
处理VMWare平台的最佳存储方式是从基础开始。
我的大型VMWare部署是10GbE以上的NFS和iSCSI。 这意味着服务器中的双端口10GbE HBA以及存储磁头。 我是基于ZFS存储的粉丝。 在我的情况下,它是围绕商业NexentaStor ,但一些select滚动自己的。
在这种情况下,基于ZFS的存储的主要function是ARC / L2ARCcachingfunction,允许您分层存储。 最活跃的数据将在RAM和SSD存储中成为第二层。 使用10k或15k SAS驱动器运行主存储池也是有益的。
这是分析和了解您的工作量的另一个案例。 与可以分析存储模式并帮助您计划的人一起工作。 在ZFS / NexentaStor方面,我喜欢PogoStorage 。 没有这种洞察力,传输方式(FC,FCoE,iSCSI,NFS)可能就不重要了。 你有任何监视你现有的基础设施? I / O活动现在是什么样的?
关键问题是:“瓶颈在哪里?” 你提到IOPS,但是这是否意味着你确定磁盘本身是瓶颈,还是仅仅是SAN端口没有运行,或者虚拟机比你想的要多得多?
如果您已经确定磁盘是限制因素,那么切换到NFS或者infiniband或者其他什么都不会影响您的性能 – 您需要SSD(或者至less将固态硬盘分层存储)或者整包更多锭子(一种解决scheme,自从世界步进电机生产冲入海洋以来,其本身已经变得更加昂贵)。
但是,如果您不能100%确定实际存在瓶颈的位置,则需要首先find – 根据其他人的猜测,或多或less地随意更换部分存储基础架构非常有效(特别是考虑到将要实施的变化是多么昂贵)。
如果你想要iscsi或nfs,那么最低限度你会想要几个10 / 40GB的端口或infiniband这是迄今为止最便宜的select,但本地存储解决schemeinfiniband似乎是有限的。 问题将是bladecenter的模块有什么select,通常是8gb fc或10 \ 1gbe,也可能是infiniband。 请注意,infiniband可以与nfs一起使用,并且在性能\价格方面没有任何结果。 如果刀片中心支持qdr infiniband,我会通过nfs与qdr infiniband tca进行某种types的linux主机。 这是一个很好的链接,描述这个http://www.zfsbuild.com/2010/04/15/why-we-chose-infiniband-teady-of-10gige
但如果bladecenter可以支持qdr infiniband,你可以买得起原生infiniband,那就是你应该select的解决scheme。
目前,你可以得到40gb的开关更便宜(这是一个奇怪的想法),然后10gbe开关,但我怀疑你是刀片中心将支持。
本地存储已经结束了 我对本地RAID 5的写吞吐量感到非常满意 – 与DRBD8镜像到我的XEN-machine的集群伙伴(当然,这是“不支持”的)。
除此之外,我很确定mySQL是你的性能问题(我从来没有看到过更糟糕的数据库)。 尝试调整它,并/或尝试将整个数据库放入文件系统caching(读取访问)…