集群服务器 Gind.cn

如何selectnfsd线程的数量

我有一个8核心的基于Linux的服务器，专门为运行批处理作业的80个Linux客户端提供NFS服务。客户端共有400个核心，一般同时运行400个单核心批处理作业。偶尔，大量批处理作业会同时尝试执行I / O操作，并耗尽当前有80个服务器上的nfsd线程数。批处理作业会发生I / O错误（例如权限被拒绝）并拯救出来。我想增加nfsd线程的数量，但想知道：在这种情况下，为了设置线程的数量，有哪些经验法则？有什么缺点，把它设置得太高？参考 Sun的这个NFS调优指南提出了Solaris的一些经验规则，但是没有给出这些特定数字的理由，所以我不知道它们是如何适用于我的Linux服务器的。这另一个给出了这种types的调整的方法，但是是非常主观的。

Mysql集群Vs基本Mysql数据库设置（不是集群）

为什么MySQL集群需要更多的内存相比，基本的MySQL数据库设置（没有集群）？ 2个不同主机上有2个mysql服务器的mysql集群的理想ram要求是什么？

即使存在小的SANnetworking问题，SBD也会同时杀死两个群集节点

我在基于openais的群集中遇到了stonith SBD的问题。一些背景：主动/被动群集有两个节点，node1和node2。它们被configuration为向用户提供NFS服务。为了避免裂脑问题，他们都被configuration为使用SBD。 SBD使用两个1MB磁盘通过多path光纤通道networking提供给主机。如果SANnetworking发生问题，问题就会出现。例如，今天一台Brocade交换机重新启动，两个节点中的每一个都丢失了4条path中的2条，导致两个节点都自杀并重新启动。这当然是非常不可取的，因为a）存在pathb）即使交换机将出现10-20秒，两个节点的重新引导周期将花费5-10分钟，并且所有的NFS锁都将丢失。我试图增加SBD超时值（到10秒+值，转储附在最后），但是“警告：延迟：4秒没有活力超过3秒的阈值”暗示有些东西不能像我期望的那样工作。这里是我想知道的：a）SBD是否工作，因为它应该在两个path可用时杀死节点？ b）如果没有，multipath.conf文件是否正确？我们使用的存储控制器是IBM SVC（IBM 2145），是否应该有任何特定的configuration？（如multipath.conf.defaults）c）我应该如何去增加SBD中的超时附件：Multipath.conf和sbd dump （ http://hpaste.org/69537 ）

Tomcat 7使用IIS webserver进行集群

我成功configuration了Apche httpd服务器，用于在同一台计算机上对多个tomcat实例进行负载平衡和群集。现在我需要使用IIS Web服务器而不是Apache服务器。我如何继续？我将如何configurationIIS服务器的Tomcat集群？

将文件系统集群为XenServer存储

我想为XenServer环境中的4个主机服务器使用共享存储，这些主机服务器在XenServer下运行各种虚拟机。计划使用2个额外的服务器作为存储与某种高可用性。虽然最明显的解决scheme是iSCSI SAN软件，但是我看到一些build议，即将iSCSI完全忽略，并转向集群文件系统 – 最显着的是GFS2和Lustre。但是，我在XenServer中看不到支持连接到这些集群系统的选项。首先，是否需要将4个XenServer主机也作为群集的一部分？当我通过Citrix下载进行安装时，我不太清楚我将如何去做，或者甚至需要。不需要超过30个VM，并且存储限制在4TB以下。在这种情况下，什么样的集群types最好？或者这对Xen不起作用？

我怎样才能修复与gluster自我愈合目录总大小

我构build了一个glusterfs集群，types是带有4个服务器的条带复制卷： Volume Name: test-volume Type: Striped-Replicate Volume ID: bdb596e6-a7d2-44a4-8791-1b4fdc57469c Status: Started Number of Bricks: 1 x 2 x 2 = 4 Transport-type: tcp Bricks: Brick1: 10.90.245.18:/exp1 Brick2: 10.90.245.35:/exp2 Brick3: 10.90.245.36:/exp3 Brick4: 10.90.245.37:/exp4 我从一个客户端挂载它，同时上传一个100G的文件到testing卷。服务器上的每个文件应该是50G。当我上传数据到集群时，我closures了一个集群服务器。当客户端完成上传文件，然后启动服务器，并启动服务glusterd。然后像这样的luslus音量治疗信息： root@alyrokif:/exp1# gluster volume heal test-volume info Gathering Heal info on volume test-volume has been successful Brick 10.90.245.18:/exp1 Number […]

当试图从NDB集群中删除表时，出现错误“4243：Index not found”

在由7个API节点，1个pipe理节点和4个NDB节点组成的基于Linux的NDB群集中，我试图删除一个表。当我尝试使用MySQL客户端删除表时，我收到以下错误： mysql> drop table table_name; ERROR 1051 (42S02): Unknown table 'database_name.table_name' 我应该可以通过使用MySQL客户端在NDB集群中删除表，但在Google上进行简短的search之后，我发现我也可以使用ndb_drop_table工具。然后我得到了以下结果： ./ndb_drop_table –ndb-nodeid=13 –ndb-mgmd-host=xx.xx.xx.xx:1186 table_name -d database_name Dropping table table_name… 4243: Index not found NDBT_ProgramExit: 1 – Failed search这个错误，我得到了一个（未答复）的结果： http : //lists.mysql.com/cluster/1608 作为最后一招，我试图删除整个数据库，但是这个命令在内部先删除所有的表，所以我得到了相同的结果： mysql> drop database database_name; ERROR 1051 (42S02): Unknown table 'database_name.table_name' 请告知如何删除此表。

为什么红帽集群套件停止工作？

我一直在CentOS 6.4上testing集群套件，并且它工作的很好，但是我今天注意到了（ 8月8日，这个问题最初被问到），它不喜欢以前工作的configuration。我尝试使用CCS从头开始重新创buildconfiguration，但是这给了validation错误。 8月21日编辑：我现在已经从CentOS 6.4 x86_64最小安装完全重新安装了这个盒子，添加了下面的包和它们的依赖关系： yum install bind-utils dhcp dos2unix man man-pages man-pages-overrides nano nmap ntp rsync tcpdump unix2dos vim-enhanced wget 和 yum install rgmanager ccs 以下命令全部起作用： ccs -h ha-01 –createcluster test-ha ccs -h ha-01 –addnode ha-01 ccs -h ha-01 –addnode ha-02 ccs -h ha-01 –addresource ip address=10.1.1.3 monitor_link=1 ccs -h […]

Galera Cluster开始备份无法在path中findinnobackupex

我正试图让Galera群集运行。我有第一个节点，准备好连接。然而，我的第二个节点，当试图运行wsrep_sst_xtrabackup时，得到错误“在path中找不到innobackupex”。只要我在第二个节点上启动mysql服务，我简要地把它看作是第一个节点上的传入地址，但是它随即消失。不知道有什么需要帮助我，所以这里是我的my.cnf从第二个节点给我的问题的整个wsrep特定部分： binlog_format=ROW default_storage_engine=innodb innodb_autoinc_lock_mode=2 innodb_locks_unsafe_for_binlog=1 innodb_doublewrite=1 wsrep_provider=/usr/lib/galera/libgalera_smm.so wsrep_provider_options="gcache.size=256M; gcache.page_size=128M" wsrep_cluster_address=gcomm://firstnode wsrep_cluster_name="Cluster" wsrep_node_address="thisnode" wsrep_node_name="thisnode" wsrep_sst_method=xtrabackup wsrep_sst_auth="root:password" wsrep_node_incoming_address=this node's IP wsrep_sst_receive_address=this node's IP wsrep_slave_threads=16 我缺less一个参数或xtrabackup？编辑：尝试将“firstnode”名称更改为实际的IP地址。没有帮助。

多个使用JBoss集群的httpd：提供httpd HA

我有一个这样的工作configuration： +—–+ +—–+ +—–+ +—–+ | i1 | | i2 | | i3 | … | in | JBoss Cluster +–+–+ +–+–+ +–+–+ +–+–+ | | | | +———-+—–+—-+—-…—-+ | +—+—+ | httpd | +——-+ | WAN 也就是说， httpd平衡负载并为HA提供JBoss集群。现在，我需要为httpd提供HA。如果httpd服务器出现故障，应该使用另一个同一个作业（JBoss集群中的LB和HA）进行备份。我不知道如何pipe理会话数据，如果两个httpd实例之间的简单HAconfiguration可以正常工作。有没有人遇到这样的情况？

Intereting Posts

允许人们看到我的网站WAMP 打开apache服务器到网页 PXE启动Fedora 17错误我应该保留前雇主的数据吗？迁移到新的Linux RHEL主机/服务器 – 移动文件夹时出错150 在没有使用符号链接的情况下在Apache中创build虚拟目录的正确方法是什么？在Windows 7 64位上将explorer作为32位运行 PhpLdapAdmin – 如何禁用用户/ uid？ Windows 2008 Standard 64bit在路由和远程访问服务器安装向导中只有VPN和拨号选项在IIS7上的电子邮件编码如果索引与Web应用程序的其余部分不在同一文件夹中，请设置nginx Microsoft Project能否在没有Sharepoint Server的情况下使用？用虚拟机代替40多台台式机 – build议？ Bash脚本在命令行中工作，但不通过PHP 直接从本地数据存储部署VMWare ESX ofv模板

Articles of 集群