Articles of 集群

如何selectnfsd线程的数量

我有一个8核心的基于Linux的服务器,专门为运行批处理作业的80个Linux客户端提供NFS服务。 客户端共有400个核心,一般同时运行400个单核心批处理作业。 偶尔,大量批处理作业会同时尝试执行I / O操作,并耗尽当前有80个服务器上的nfsd线程数。批处理作业会发生I / O错误(例如权限被拒绝)并拯救出来。 我想增加nfsd线程的数量,但想知道: 在这种情况下,为了设置线程的数量,有哪些经验法则? 有什么缺点,把它设置得太高? 参考 Sun的这个NFS调优指南提出了Solaris的一些经验规则,但是没有给出这些特定数字的理由,所以我不知道它们是如何适用于我的Linux服务器的。 这另一个给出了这种types的调整的方法,但是是非常主观的。

Mysql集群Vs基本Mysql数据库设置(不是集群)

为什么MySQL集群需要更多的内存相比,基本的MySQL数据库设置(没有集群)? 2个不同主机上有2个mysql服务器的mysql集群的理想ram要求是什么?

即使存在小的SANnetworking问题,SBD也会同时杀死两个群集节点

我在基于openais的群集中遇到了stonith SBD的问题。 一些背景:主动/被动群集有两个节点,node1和node2。 它们被configuration为向用户提供NFS服务。 为了避免裂脑问题,他们都被configuration为使用SBD。 SBD使用两个1MB磁盘通过多path光纤通道networking提供给主机。 如果SANnetworking发生问题,问题就会出现。 例如,今天一台Brocade交换机重新启动,两个节点中的每一个都丢失了4条path中的2条,导致两个节点都自杀并重新启动。 这当然是非常不可取的,因为a)存在pathb)即使交换机将出现10-20秒,两个节点的重新引导周期将花费5-10分钟,并且所有的NFS锁都将丢失。 我试图增加SBD超时值(到10秒+值,转储附在最后),但是“警告:延迟:4秒没有活力超过3秒的阈值”暗示有些东西不能像我期望的那样工作。 这里是我想知道的:a)SBD是否工作,因为它应该在两个path可用时杀死节点? b)如果没有,multipath.conf文件是否正确? 我们使用的存储控制器是IBM SVC(IBM 2145),是否应该有任何特定的configuration? (如multipath.conf.defaults)c)我应该如何去增加SBD中的超时 附件:Multipath.conf和sbd dump ( http://hpaste.org/69537 )

Tomcat 7使用IIS webserver进行集群

我成功configuration了Apche httpd服务器,用于在同一台计算机上对多个tomcat实例进行负载平衡和群集。 现在我需要使用IIS Web服务器而不是Apache服务器。 我如何继续? 我将如何configurationIIS服务器的Tomcat集群?

将文件系统集群为XenServer存储

我想为XenServer环境中的4个主机服务器使用共享存储,这些主机服务器在XenServer下运行各种虚拟机。 计划使用2个额外的服务器作为存储与某种高可用性。 虽然最明显的解决scheme是iSCSI SAN软件,但是我看到一些build议,即将iSCSI完全忽略,并转向集群文件系统 – 最显着的是GFS2和Lustre。 但是,我在XenServer中看不到支持连接到这些集群系统的选项。 首先,是否需要将4个XenServer主机也作为群集的一部分? 当我通过Citrix下载进行安装时,我不太清楚我将如何去做,或者甚至需要。 不需要超过30个VM,并且存储限制在4TB以下。 在这种情况下,什么样的集群types最好? 或者这对Xen不起作用?

我怎样才能修复与gluster自我愈合目录总大小

我构build了一个glusterfs集群,types是带有4个服务器的条带复制卷: Volume Name: test-volume Type: Striped-Replicate Volume ID: bdb596e6-a7d2-44a4-8791-1b4fdc57469c Status: Started Number of Bricks: 1 x 2 x 2 = 4 Transport-type: tcp Bricks: Brick1: 10.90.245.18:/exp1 Brick2: 10.90.245.35:/exp2 Brick3: 10.90.245.36:/exp3 Brick4: 10.90.245.37:/exp4 我从一个客户端挂载它,同时上传一个100G的文件到testing卷。 服务器上的每个文件应该是50G。 当我上传数据到集群时,我closures了一个集群服务器。 当客户端完成上传文件,然后启动服务器,并启动服务glusterd。 然后像这样的luslus音量治疗信息: root@alyrokif:/exp1# gluster volume heal test-volume info Gathering Heal info on volume test-volume has been successful Brick 10.90.245.18:/exp1 Number […]

当试图从NDB集群中删除表时,出现错误“4243:Index not found”

在由7个API节点,1个pipe理节点和4个NDB节点组成的基于Linux的NDB群集中,我试图删除一个表。 当我尝试使用MySQL客户端删除表时,我收到以下错误: mysql> drop table table_name; ERROR 1051 (42S02): Unknown table 'database_name.table_name' 我应该可以通过使用MySQL客户端在NDB集群中删除表,但在Google上进行简短的search之后,我发现我也可以使用ndb_drop_table工具。 然后我得到了以下结果: ./ndb_drop_table –ndb-nodeid=13 –ndb-mgmd-host=xx.xx.xx.xx:1186 table_name -d database_name Dropping table table_name… 4243: Index not found NDBT_ProgramExit: 1 – Failed search这个错误,我得到了一个(未答复)的结果: http : //lists.mysql.com/cluster/1608 作为最后一招,我试图删除整个数据库,但是这个命令在内部先删除所有的表,所以我得到了相同的结果: mysql> drop database database_name; ERROR 1051 (42S02): Unknown table 'database_name.table_name' 请告知如何删除此表。

为什么红帽集群套件停止工作?

我一直在CentOS 6.4上testing集群套件,并且它工作的很好,但是我今天注意到了( 8月8日,这个问题最初被问到 ),它不喜欢以前工作的configuration。 我尝试使用CCS从头开始重新创buildconfiguration,但是这给了validation错误。 8月21日编辑: 我现在已经从CentOS 6.4 x86_64最小安装完全重新安装了这个盒子,添加了下面的包和它们的依赖关系: yum install bind-utils dhcp dos2unix man man-pages man-pages-overrides nano nmap ntp rsync tcpdump unix2dos vim-enhanced wget 和 yum install rgmanager ccs 以下命令全部起作用: ccs -h ha-01 –createcluster test-ha ccs -h ha-01 –addnode ha-01 ccs -h ha-01 –addnode ha-02 ccs -h ha-01 –addresource ip address=10.1.1.3 monitor_link=1 ccs -h […]

Galera Cluster开始备份无法在path中findinnobackupex

我正试图让Galera群集运行。 我有第一个节点,准备好连接。 然而,我的第二个节点,当试图运行wsrep_sst_xtrabackup时,得到错误“在path中找不到innobackupex”。 只要我在第二个节点上启动mysql服务,我简要地把它看作是第一个节点上的传入地址,但是它随即消失。 不知道有什么需要帮助我,所以这里是我的my.cnf从第二个节点给我的问题的整个wsrep特定部分: binlog_format=ROW default_storage_engine=innodb innodb_autoinc_lock_mode=2 innodb_locks_unsafe_for_binlog=1 innodb_doublewrite=1 wsrep_provider=/usr/lib/galera/libgalera_smm.so wsrep_provider_options="gcache.size=256M; gcache.page_size=128M" wsrep_cluster_address=gcomm://firstnode wsrep_cluster_name="Cluster" wsrep_node_address="thisnode" wsrep_node_name="thisnode" wsrep_sst_method=xtrabackup wsrep_sst_auth="root:password" wsrep_node_incoming_address=this node's IP wsrep_sst_receive_address=this node's IP wsrep_slave_threads=16 我缺less一个参数或xtrabackup? 编辑:尝试将“firstnode”名称更改为实际的IP地址。 没有帮助。

多个使用JBoss集群的httpd:提供httpd HA

我有一个这样的工作configuration: +—–+ +—–+ +—–+ +—–+ | i1 | | i2 | | i3 | … | in | JBoss Cluster +–+–+ +–+–+ +–+–+ +–+–+ | | | | +———-+—–+—-+—-…—-+ | +—+—+ | httpd | +——-+ | WAN 也就是说, httpd平衡负载并为HA提供JBoss集群。 现在,我需要为httpd提供HA。 如果httpd服务器出现故障,应该使用另一个同一个作业(JBoss集群中的LB和HA)进行备份。 我不知道如何pipe理会话数据,如果两个httpd实例之间的简单HAconfiguration可以正常工作。 有没有人遇到这样的情况?