VMware和许多networking传播者试图告诉你,复杂(昂贵)的光纤SAN是VMware ESX和ESXi服务器的“唯一”存储选项。 嗯,当然是的。 使用SAN是快速,可靠的,并使vMotion成为可能。 大。 但是:所有的ESX / ESXi用户真的可以承受SAN吗? 我的理论是,在这个星球上的所有VMware ESX安装实际上不到20%实际上使用光纤或iSCS SAN。 大多数这些安装将在大公司谁可以负担得起的。 我预测大多数VMware安装使用“附加存储”(vmdks存储在服务器内的磁盘上)。 他们中的大多数都在中小企业中运作,其中有很多! 我们运行两台具有附加存储的ESX 3.5服务器和两台具有iSCS san的ESX 4服务器。 而两者之间的“真正的现实差异”几乎不显着:-) 你知道这个问题的官方统计吗? 你用什么作为存储介质?
随着Hadoop和CouchDB遍布博客和相关新闻什么是实际工作的分布式容错存储(引擎)。 CouchDB实际上并没有任何内置的分发function,据我所知,粘贴来自动分发条目,甚至整个数据库是完全没有。 Hadoop似乎被广泛使用 – 至less它得到了很好的新闻,但仍然有单点故障:NameNode。 另外,它只能通过FUSE安装,我知道HDFS实际上并不是Hadoop的主要目标 GlusterFS的确有一个共享的概念,但最近我读了几个post,导致我认为它不太稳定 Lustre使用专用的元数据服务器也有单点故障 Ceph似乎是select的球员,但主页表明它仍然处于alpha阶段。 所以问题是哪个分布式文件系统具有以下function集(没有特定的顺序): POSIX兼容 易于添加/删除节点 无共享的概念 在便宜的硬件上运行(AMD Geode或VIA Eden级处理器) authentication/授权内置 一个networking文件系统(我想能够在不同的主机上同时安装) 很高兴有: 本地可访问的文件:我可以用一个标准的本地文件系统(ext3 / xfs / whatever …)来下载一个节点,并仍然可以访问文件 我不是在寻找托pipe的应用程序,而是让我可以说我们的每个硬件盒10GB,并有我们的networking中可用的存储,可以轻松安装在多个主机上。
FC交换机如何工作,我应该如何configuration我的?
我可以使用服务器中安装的单个Fusion-io卡来可靠运行吗?还是需要在软件RAID设置中部署两个卡? Fusion-io在回顾他们的营销材料时并不十分清楚(几乎误导)鉴于这些卡的成本,我很好奇其他工程师是如何在真实世界的场景中部署的。 我计划使用HP品牌的 Fusion-io ioDrive2 1.2TB卡作为在Linux上运行的专有独立数据库解决scheme。 这是一个单一的服务器设置,没有真正的高可用性选项。 有一个10分钟的RPOasynchronous复制,将事务日志镜像到第二个物理服务器。 传统上,我将指定一台高端的HP ProLiant服务器,并为此应用程序提供最高级别的CPU。 我需要去SSD,而且我能以比所需容量更低的价格获得Fusion-io。 我是否需要运行两个ioDrive2卡,并使用软件RAID(md或ZFS)join,还是不必要? 我应该担心Fusion-io的失败吗?我会担心RAID控制器故障或主板故障吗? 系统pipe理员喜欢RAID。 这是否需要一个不同的思维模式,考虑到这种外形的不同接口和卡内损耗均衡/纠错? 这些设备的故障率是多less? 编辑:我刚刚从戴尔读了Fusion-io可靠性白皮书 ,外包似乎是“Fusion-io卡有很多内部冗余……不要担心RAID! 。
我pipe理的大部分Linux系统都是function硬件RAID控制器(主要是HP Smart Array )。 他们都运行RHEL或CentOS。 我正在寻找真实世界的可调参数来帮助优化将硬盘RAID控制器与SAS磁盘(Smart Array,Perc,LSI等)以及电池供电或闪存备份caching相结合的设置的性能。 假设RAID 1 + 0和多个主轴(4个以上的磁盘)。 我花了相当多的时间调整Linuxnetworking设置以适应低延迟和金融交易应用。 但是其中的许多选项都有详细logging(更改发送/接收缓冲区,修改TCP窗口设置等)。 工程师在存储方面做了什么? 从历史上看,我对I / O调度电梯进行了修改,最近select了deadline和noop调度程序来提高我的应用程序的性能。 随着RHEL版本的进步,我也注意到SCSI和CCISS块设备的编译默认值也发生了变化。 这对build议的存储子系统设置随着时间的推移已经产生了影响。 但是,从我看到任何明确的build议已经有一段时间了。 而且我知道操作系统默认不是最佳的。 例如,对于在服务器级硬件上部署,似乎128kb的默认预读缓冲区非常小。 以下文章探讨了在块队列上更改预读caching和nr_requests值的性能影响。 http://zackreed.me/articles/54-hp-smart-array-p410-controller-tuning http://www.overclock.net/t/515068/tuning-a-hp-smart-array-p400-with-linux-why-tuning-really-matters http://yoshinorimatsunobu.blogspot.com/2009/04/linux-io-scheduler-queue-size-and.html 例如,这些是对HP智能arraysRAID控制器的build议更改: echo "noop" > /sys/block/cciss\!c0d0/queue/scheduler blockdev –setra 65536 /dev/cciss/c0d0 echo 512 > /sys/block/cciss\!c0d0/queue/nr_requests echo 2048 > /sys/block/cciss\!c0d0/queue/read_ahead_kb 还有什么可以可靠地调整,以提高存储性能? 我特别在生产场景中寻找sysctl和sysfs选项。
我们将有一台机器在工作,在高峰时performance,应该能够每小时推送50个(“写头”)75GB的数据。 这是〜1100MB / s写入速度的高峰performance。 为了从机器上获得,需要两条10GBi线。 我的问题是什么样的服务器+技术可以处理/存储这样的数据stream? 目前我们使用ZFS进行数据存储,但写入速度从来都不是问题。 (我们甚至没有接近这些速度)ZFS(linux上的zfs)是否是一个选项? 我们还需要存储大量的数据,“IT指南”build议总数在50-75TB之间。 因此,除非我们想提供我们的第一个孩子,否则它可能不是所有的固态硬盘。 一些基于优秀回复的补充: 小于24小时(最可能小于6小时),最大值为50x75GB /小时, 我们预计这种情况不会很快发生,很可能我们将运行5-10x75GB /小时 这是一个前置alpha机器,但是需要满足(即使很多问号正在播放) 我们将使用NFS作为从机器到服务器的连接 布局:生成机器 – >存储(这一个) – >(安全RAID 6) – >计算集群 所以读取速度并不是必需的 ,但是从计算集群中使用它会很好(但是这是完全可选的) 最有可能的是大数据文件(不是很less)
我想build立一个存储服务器,并购买了10个2TB的WD RED的。 硬盘刚刚到达。 在将真实数据拷贝到磁盘之前,是否有任何工具可用于检查坏的驱动器或最好地防御婴儿死亡率? 检查每个硬盘还是通过复制大量数据来testingarrays(ZFS raid-z2)会更好? 提前感谢您的build议!
这是关于iSCSI的规范问题 ,我们可以用作参考。 iSCSI是一种将SCSI命令作为有效负载放入TCPnetworking数据包的协议。 因此,它受到与光纤通道不同的一系列问题的困扰。 例如,如果一个链路拥塞并且交换机的缓冲区已满,以太网将默认丢弃帧,而不是告诉主机减速。 这导致重传,这导致存储stream量的很小部分的高延迟。 有针对此问题的解决scheme,具体取决于客户端操作系统,包括修改networking设置。 对于以下的操作系统列表,最佳的iSCSI客户端configuration是什么样的? 会涉及到更改交换机上的设置? 那储物柜呢? VMWare 4和5 Windows Hyper-V 2008和2008r2 Windows 2003和2008裸机 裸机上的Linux AIX VIO 你碰巧认为的任何其他操作系统都是相关的
我将首先指出,我不相信这是为什么企业存储这么昂贵的重复? 。 我的问题是具体关于SAS驱动器机箱,并说明他们的费用。 我所指的shelltypes的例子是: 1个 HP D2700 2戴尔MD1220 IBM EXP3524 上述每一个都是2U直接连接的外部SAS驱动器机箱,空间大约为24 X 2.5“驱动器。 我正在谈论的是裸机,而不是驱动器。 我知道企业级硬盘和消费者级别之间的区别。 作为“ball-park”价格的一个例子,目前惠普D2700(25X2.5“硬盘)目前售价为1750美元左右, 没有任何硬盘 (亚马逊美国12月12日查询),低端HP DL360服务器价格大概在2000美元左右。 CPU,RAM,主板,SAS RAID控制器,networking以及用于8 X 2.5“硬盘的插槽。 当向客户或pipe理人员提供具有存储的build议的服务器的成本细目时,看起来奇怪的是,shell是一个重要的项目,因为它本质上是被动的(除非我错了)。 我的问题是: 我误解了SAS驱动器机箱的组件吗? 是不是只有一个带有电源,SAS电缆和大量驱动器空间的被动式机箱? 为什么成本看起来如此昂贵,尤其是与服务器相比。 考虑到机箱没有的所有组件(主板,CPU,RAM,networking,video),我期望一个机箱要便宜得多。 目前,我们向客户推荐服务器时的策略是避免因为机箱的价格而推荐外置驱动器机箱。 但是,假设无法将足够的驱动器物理上安装到基本服务器中,并且客户端没有可用的SAN或NAS,则机箱是明智的select。 能够向客户解释为什么shell的成本与其一样高,这将是很好的。
我了解IOPS和吞吐量。 吞吐量度量数据stream量,MB / s和IOPS表示每秒发生多less次I / O操作。 我不明白的是为什么许多存储服务只显示它们提供的IOPS。 我真的不能看到任何我更想知道IOPS而不是吞吐量的场景。 为什么IOPS很重要? 为什么AWS主要在IOPS中显示其存储规定? IOPS在哪里比吞吐量(MB / s)更重要? 编辑: 有些人正在研究这个问题,就好像我问过什么样的随机存取以及它是如何影响性能或HDD和SSD如何工作的……尽pipe我认为这些信息对于新手来说是非常有用的,但是很多关注点正在被应用对于这个问题,这不是问题的目标,问题是“当我看到一个IOPS编号时,会得到什么样的新信息,以致于我看不到吞吐量(MB / s)数?