Articles of linux

多个物理服务器Linux DB和应用程序环境:靠近数据中心居住的必要条件?

在物理服务器环境下,即使在全国各地都有更好的数据中心select,build议像数据中心一样居住在同一个主要城市。 主机和带宽成本,事件响应时间和持续旅行成本是主要关注的问题。 正常运行时间很重要,但是我们可以每年忍受一次半天的数据中心停机。 我正在计划一个数据中心应用程序部署,其中大约有十几台物理Linux主机(具有更多的function),每个主机都使用本地存储或备用数据库服务器或应用程序服务器定义数据库服务器的angular色。 这些机器将共享一个VLAN,并利用一些DAS第二线存储进行存档。 没有计划的虚拟化,除了一些可能大大利用物理机器的待机angular色。 附近的远程数据中心都提供有偿的工程支持。 目前我无法确定工程师在问题情况下能够了解我们的具体架构。 假设在紧急情况之间漫长的平均时间,我猜他们不会是那么熟悉的,甚至是相同的人。 我pipe理的远程服务器具有独立的angular色,多年来一直托pipe在数据中心之外,安装后永远不会看到机器。 我的问题来自StackExchange podcast,在这种情况下,物理networking硬件在快速通信的服务器负载下间歇性地变慢,需要长时间进行大量的debugging。 高端networking硬件超出了我目前的经验,这种types的故障排除在远程连接中是否可行,或者当这种情况发生时需要到现场是很常见的现象? 总而言之,在开展此类部署时,在主要城市的一个好的数据中心附近居住可以获得多less收益? 它是否超过了更大/更好的城市中更好/最好的数据中心的好处? 感谢您分享您在这方面的经验。 杰夫

Apache和Plone之间build立的连接数量不断增加

我们使用mod_proxy_balancer在Apache后面运行Plone 4.1,Zope 2.13。 我们有2个zope实例,每个运行2个线程。 我们看到Zope和Apache之间有许多连接正在build立,但从未发布(或者至less它们已经徘徊了很长时间)。 这正在我们的现场testing系统上发生。 试图在我们的testing系统上进行分析: 其中一个zope实例的pid是17577 # netstat -a -p | fgrep 17577/ tcp 0 0 *:18091 *:* LISTEN 17577/python tcp 0 0 dev.ic.soschildrensvi:18091 dev.ic.soschildrensvi:36932 ESTABLISHED 17577/python tcp 0 0 dev.ic.soschildrensvi:18091 dev.ic.soschildrensvi:36931 ESTABLISHED 17577/python tcp 0 0 dev.ic.soschildrensvi:18091 dev.ic.soschildrensvi:36929 ESTABLISHED 17577/python tcp 0 0 dev.ic.soschildrensvi:18091 dev.ic.soschildrensvi:36940 ESTABLISHED 17577/python tcp 0 0 dev.ic.soschildrensvi:18091 dev.ic.soschildrensvi:36936 […]

寻找build议findSamba服务器的瓶颈

我的LAN结构: PC作为Samba客户端,IP:192.168.1.12 运行Samba服务器的NAS路由器,IP:192.168.1.1。 NAS路由器使用USB密钥作为其存储设备,USB具有15MB / s的最大速度。 客户端下载一个需要42.1s的310MB文件,即7.36MB / s。 在传输过程中分析结果(NAS路由器的linux堆栈具有oprofile内置)显示CPU处于default_idle函数的CPU时间约为37%。 我想知道为什么有这么高的default_idle部分。 这是我做的: 我从USB复制文件到路由器的ramfs。 下载速度达到15MB / s。 我在NAS路由器和PC上build立iperf来testingnetworking的最大传输速率。 iperf结果显示双向最大速度约为11.4MB / s。 那么,现在似乎7.36MB / s的限制是由桑巴套件引起的。 find引起这个限制的地方也许可以帮助解释default_idle函数的高部分。 但是我不知道如何继续。 请给出一些build议和build议。 谢谢

挂载CIFS文件系统:错误-1打开凭证文件

我试图通过fstab和netfs在CentOS 5.x盒子上永久挂载一个windows服务器共享。 我可以通过以下命令成功安装和访问共享: mount.cifs //winserver.addomain.int/shared /mnt/foo –verbose -o rw,-dom=addomain,credentials=/opt/foo2/etc/cred.file,dir_mode=0775,file_mode=0664,soft 这工作正常。 所以然后我卸载它,并添加以下行到/ etc / fstab: //winserver.addomain.int/shared /mnt/foo cifs rw,-dom=addomain,credentials==/opt/foo2/etc/cred.file,dir_mode=0775,file_mode=0664,soft 0 0 而当我运行服务netfs开始我得到以下错误: Mounting CIFS filesystems: error -1 opening credential file 为了安全起见,我已经将凭据文件的所有者和组设置为root:root和文件权限为0400 我以root用户身份运行所有命令(包括mount test和netfs start命令),所以我不明白为什么会有权限问题。 我也testing了另一个盒子上的这个过程(有不同的份额),它工作正常。 有人可以告诉我,如果有任何netfsdebugging日志,我可以在这里检查? 我还能做些什么来排除故障?

为什么启动后无法在进程列表中看到monit二进制文件?

我有monit运行和工作(我设置了一个虚假的警告正在发送),但在进程列表中看不到任何称为“monit”的二进制文件。 此外,如果我用最新的进程对进程进行sorting,我所看到的唯一的事情就是有关monit发送电子邮件的过程 – 我没有看到monit二进制文件本身。 更多信息 我用apt-get monit安装了它 我开始service monit start #ps -ef | grep monit 根29985 23882 0 02:07 pts / 0 00:00:00 grep –color = auto monit`

大的延迟开始“dd”在bash的背景下写入,即使使用nohup

我写了一个小脚本来打印内存使用情况,在一个大的顺序写入文件。 #!/bin/bash rm result echo 3 > /proc/sys/vm/drop_caches sync; echo start nohup time dd if=/dev/zero of=mem bs=1M count=2000 & for i in {1..200} do sleep 0.2 cat /proc/meminfo | grep Dirty >> result cat /proc/meminfo | grep Dirty done cat nohup.out cat result 我应该从运行开始就看到“脏”的大小的增加。 但是当我运行这个脚本的时候,经常会看到一个很大的延迟(最多几秒钟),在这个过程中,“Dirty”大小不会增加,这可能意味着“dd”程序的启动被延迟了。 示例有问题的输出是: Dirty: 20 kB Dirty: 20 kB Dirty: 20 kB […]

Kerberos高可用性故障转移,Apache Mod_auth_kerb,使用Kerberos从站速度很慢

我们在Apache内部使用Mod_auth_kerb和我们的内部Kerberos进行身份validation,从而在内部托pipe我们自己的Redmine rails Web应用程序。 我们有2个内部Kerberos服务器KDC1和KDC2。 KDC1是主人。 KDC2是KDC1的奴隶。 当KDC1正在工作,我们没有问题,Redmine在我们的Apache与乘客设置是响应。 Kerberos服务器正在运行Debian Lenny Redmine Apache2服务器正在运行Debian Squeeze 由于最近出现了一些硬件问题,KDC1脱机。 在这段时间里,每一个Redmine的页面加载速度都非常慢,每个页面加载需要大约10秒。 Redmine的工作,通过名为KDC2奴隶的Kerberos身份validation工作,但它非常缓慢。 对于每个Redmine页面加载,Redmine Apache系统将开始查找KDC1并最终使用KDC2。 这个过程每次花费几秒钟。 我尝试在Redmine Apache服务器的/etc/krb5.conf中使用以下不同值的选项 [libdefaults] default_realm = DOMAIN.COM kdc_timeout = 1 max_retries = 0 我尝试了不同的值,我运行tcpdump来查看延迟是在哪里,看看是否改变上述设置有所不同,我没有看到tcpdump捕获或浏览器中的Redmine页面加载的任何差异。 我做错了吗? 是否有可能使我们的Redmine Apache系统使用KDC2更快,更快,如果KDC1失败,速度不会明显变慢? 什么是一些好的方法或什么是设置Kerberos进行高可用性故障转移的最佳方式? 如果我不能加速上面的我们使用奴隶,那么我可以尝试其他的东西,而不是从属,创build两个相同的KDC1服务器,并使用心跳来故障转移IP地址为kdc1.domain.com在事件失败或什么的。 我还没有得到。 提前致谢。

大量的ACPI中断

我想知道以前是否有人看到过这个问题,也许可以解决一些问题。 我正在运行红帽企业版Linux 6.1,在纯文本服务器configuration中完全更新,并且kacpid和kacpi_notify进程分别占用了CPU时间的70%和〜15%。 我已经将问题追溯到看起来像是疯狂的ACPI中断: [root@centauri ~]# cat /proc/interrupts | grep acpi; sleep 5; cat /proc/interrupts | grep acpi 9: 447753 0 32693472 0 IO-APIC-fasteoi acpi 9: 447753 0 32850749 0 IO-APIC-fasteoi acpi 超过30k中断一秒,显然是错误的。 另外,如果我使用非常相似的硬件configuration检查另一台服务器,那么这个特定中断的中断计数总是为零。 这两个系统都运行禁用超线程的Core i7 2600K处理器。 我已经尝试重置BIOS中的所有默认值,但没有运气。 任何想法可能会导致如此之多的中断? 如果我用acpi = off启动,这个问题就会消失。 除了电源控制,在ACPI禁用的情况下运行系统还有什么缺点吗?

使用来自linux的OSX主目录

我正在运行带有OpenDirectory的OSX(Snow Leopard)服务器,这是一个修改后的OpenLDAP和一些苹果专用模式的其他内容。 不过,我想在我的一些Linux(Debian Squeeze)盒子上重复使用这个目录。 对OSX的LDAP服务器进行身份validation是没有问题的,这已经很好了。 我所苦恼的是在OSX中指定主文件夹的方式。 如果我在其中一台Linux机器上查询passwdconfiguration,OSX导入的项目看起来像这样 myaccount:x:1034:1026:Firstname Lastname:/Network/Servers/hostname.example.com/Volumes/MyShare/Users/myaccount:/bin/bash 虽然这些networking家庭文件夹可能适用于OSX客户端,但我不希望这些基于服务器的path在我的Linux机器上。 我看到在OSX用户检查器中有一个NFSHomeDirectory属性,但是如果我改变这个,整个用户主path被改变。 由于我的用户应该能够在两个系统,OSX和Linux上login,这不是我想要的。 有没有人有一个想法,我必须如何configurationOSX,使我的Linux机器像/ net / myaccount这样的家庭文件夹,并保持OSX客户端的configuration不变?

configurationOpenSCEP自动授予证书请求

我想设置一个OpenSCEP服务器,可以自动授予证书,而不是每次有新的请求时运行scepgrant命令? 有人可以让我知道如何进行configuration? 从安全angular度来看,我知道这不是一个好主意,我试图做的是自动化一些证书注册testing。 自动打开授予证书请求将是一件好事。