有没有人有任何资源可以让我知道在CentOS上build立集群FTP服务器的方法或至less更多的信息? 一般来说,我对服务器很陌生(我所做的只是设置一个简单的Linux机器来运行Ruby on Rails应用程序),所以如果可能的话,我真的很想要一个方法。 此外,这可能是最重要的:我有一台服务器成功运行vsftpd 。 如果我所缺less的只是几个步骤让这个服务器与另一个集群,请让我知道。
我知道这个话题很奇怪,但我的问题也是如此。 在我们的集群中,我们将SMP与OpenMPI进行了紧密集成编译。 当我设置它时,在我的testing中工作得很好,直到最近才有人投诉。 事情是:当我使用OpenMPI PE提交作业并使用mpirun运行我的二进制文件时,它失败。 错误信息就像 fully.quallified.host.name – daemon did not report back when launched [hostname:\d{5}] [[63730,0],\d{1,2}] routed:binomial: Connection to lifeline [[63730,0],0] lost 即使是像mpirun -np 40 –pernode hostname这样简单的东西 现在这里是怪异的部分:如果我打开详细输出plm_base它的作品: mpirun -np 40 –mca plm_base_verbose 5 –pernode hostname确实工作! 在stderr上产生的debugging输出负载不包含任何问题。 我已经尝试了多次,我总是可以重现这一点,所以我相当肯定,这不仅仅是一种侥幸。 问题是:我现在很困惑。 我当然会错过一些事情,所以这里有一些问题: 在这种情况下设置详细程度是否也默默设置其他参数? 还有什么会导致这种奇怪的行为? 最好的祝福。 编辑:configuration相关PE: pe_name ompi-gcc slots 2000 user_lists NONE xuser_lists NONE start_proc_args /bin/true […]
我目前正在运行一个2008年的R1 64位集群。 昨天晚上,我们被我们的第一层支持调用,我们有一个失败的群集磁盘。 在5PM我们收到以下错误: 群集物理磁盘资源“群集磁盘1”无法联机,因为找不到关联的磁盘。 磁盘的预期签名是'{f575935a-d2aa-4a6e-9345-f127ae1349cf}'。 如果replace或还原磁盘,则在“故障切换群集pipe理”pipe理单元中,可以使用修复function(在磁盘的属性表中)来修复新的或恢复的磁盘。 如果磁盘不能被replace,请删除关联的磁盘资源。 当我尝试修复磁盘时,出现以下错误。 “没有find适合于群集磁盘的磁盘,有关群集可用磁盘的诊断信息,请使用”validationconfiguration向导“来运行”存储testing“。 没有任何服务closures,除此驱动器以外的其他群集资源均未closures。
我有一个MySQL集群,拥有两个数据存储节点,最近两年运行。 就在最近我观察到其中一个节点(数据存储)的硬件问题。 我可能需要用新的节点replace这个节点。 如果有人能提出最好的办法,这将是非常好的。 我正试图防止在这个过程中丢失任何数据。 如果我不使用与其他节点中安装的相同的mysql版本,那么是否可以。
所以我已经成功地build立了SQL Server 2008的2节点2008 R2集群。 基本上有3个networking。 公共(客户端LAN) 私人(两台机器之间的心跳) iSCSI SAN(主机见证磁盘和SQL存储) 通过断开公共networking,手动传输服务以及重新启动其中一台机器,我已经成功实现了群集故障转移。 我不能得到故障转移是当我从托pipe机器上的iSCSInetworking连接。 该服务的表面平坦下来,直到我重新插入并手动将服务联机后才能恢复。 我的仲裁模式是Node and Disk Majority 。 我的理解是,如果计算机1失去与公共networking或iSCSI资源的连接,则整个群集应故障转移到仍与两个networkingbuild立连接的计算机2。
我们正在部署一个包含4个节点的GlusterFS集群,我们希望在其上部署4个节点的Percona XtraDB集群,每个节点将有一个来自GlusterFS的安装文件夹,每个安装将是一个独立的文件夹,而不是共享的文件夹。 GlusterFS的总体规模将在6TB-8TB左右,我们计划在未来两个月部署到20TB。 卷将有4个NFS导出,每个Percona XtraDB集群节点一个。 这些是我们迄今为止的计划,但是我需要的是一个build议,如果这个设置是推荐的,或者更好的,你有什么build议像这样的设置? GlusterFS集群将去,因为我们有其他服务器将共享一些文件(这不会是它的主要目的,这个文件将很less被访问,但这些文件需要在该集群上)。 我们需要的是一个用于高可用性和负载平衡的数据库集群,我们正在考虑使用主要的glusterfs来存储数据库。 我们知道在所有节点上使用相同的db文件是一个坏主意,这就是我们将有4个NFS挂载的原因,每个db节点一个。 我希望你能理解我的观点,并且可以为这个需求提供一些很好的build议。 顺便说一句,所有的服务器将是最新版本的Ubuntu服务器。 提前致谢。
有哪些方法可以防止用户在Rocks集群的headnode上启动长时间运行的资源密集型进程? 我试过了: 有礼貌地问 将limits.conf中的优秀级别设置为19.没有预期的效果。 进程运行在19好的水平,但机器仍然没有反应(可能是内存) 我在考虑: 将时间/内存限制放在limits.conf中 打破像/ bin / python这样的stream行程序的链接。 似乎笨重 其他想法: 禁止违规用户不是一种select 有时用户需要运行交互式会话。 这可以通过使用qrsh通过控制台启动一个来完成,所以真的不需要在头节点上运行任何东西
我创build了一个Windows服务,它承载着查看/绑定到群集MSMQ的WCF应用程序Windows服务首次安装在群集的两个节点上。 然后我通过高可用性向导(select通用服务)创build了一个集群。 将数据发送到群集MSMQ(从群集外部但是相同域/networking)的客户端发送到群集MSMQ罚款。 群集中的一个节点通过Windows服务(通过debugging跟踪来validation这个) 然后,当NodeA出现故障时,NodeB 应该启动,但无法启动Clustered Windows Service,完全没有任何解释! 它做了几次,但仍然失败。 我必须通过services.msc在此节点上手动启动Windows服务,然后才能正常工作,服务已启动并正在运行,并继续处理来自群集MSMQ的消息。 有些事情显然不在这里。 为什么当其中一个节点出现故障时,群集服务无法“启动”? 我究竟做错了什么? 错在哪里设置? 谢谢。
理论上的小问题。 我已经完成了一些2节点的MySQL 5.1集群用户对多个MMM实例的控制。 我们开始了一些testing,快乐地杀死了作家节点,并且一切顺利,应用程序一路畅通,忘却了DBMS的混乱。 然后我想,如果在生产中第一个服务器A停机,服务器B接pipe,更多的工作完成,最后B也停止。 如果系统pipe理员首先从A重新启动集群,然后joinB,同时在A的过期数据上完成工作? MySQL是否有一个仲裁机制,使A(甚至B)处于恢复模式,直到它确定了最新的事务继续? 非常感谢,如果这是一个常见问题…
我运行一个适度大小的集群,我有一个队列问题。 例如,我有一个128GB的内存节点和一个程序,我设置每个内核的内存量。 因此,例如,如果我将内存设置为8GB,那么我将只能运行16个内核,然后再打虚拟内存,这是必须避免的。 现在我正在使用Torque作为排队方法,如果我将两个10核心作业提交到每个8GB的单个节点,它将尝试使用160GB的内存。 我想要做的是限制一个节点上的作业数量,以使它们的总内存使用量仅仅是节点的物理内存。 每个内核的内存数量是高度dynamic的,作业可以轻松使用所有物理内存,但只能使用可用内核的一小部分。 根据我的理解,通过阅读和实验,只有当作业在节点上运行后超过这些限制,并且在作业继续之前不对这些限制进行调节时,Tor才能使用pmem,vmem,mem命令。 作为一个侧面说明,这些工作中有很多只能使用后期所需内存的10%。 那么有没有办法与Torque做到这一点。 如果没有,你会build议另一个排队程序? 感谢您的时间。