我们正在构build一个医学image processing软件栈,目前托pipe在各种AWS资源上。 作为这个应用程序的一部分,我们有一些长期运行的服务器(数据库,负载平衡器,Web应用程序等)。 在这些服务器上收集性能数据非常简单 – 我使用Nagios(用于监视/通知)和Munin(用于收集性能数据和显示趋势)的配方工作得很好。 但是,作为此应用程序的一部分,我们不断启动和终止EC2上的计算实例。 在典型用法中,这些计算实例启动,configuration自己,从消息队列接收作业,然后开始处理该作业,这需要15分钟到8小时以上的时间。 工作完成后,这些实例被终止,永远不会再被听到。 在这些短暂的实例中收集性能数据的体面战略是什么? 我不一定需要对他们进行监控 – 如果他们因为某种原因失败了,我们的应用程序会检测到这个情况,并处理另一个实例的重新启动工作,或者提升这个标志,这样pipe理员就可以看看事情了。 但是,收集CPU(用户,空闲,iowait等),内存使用情况,networkingstream量,磁盘读写数据等信息仍然是有用的。在我们的内部数据库中,我们跟踪机器的实例ID运行每个作业,查找特定实例ID的性能数据以进行故障排除和分析将非常有帮助。 Munin似乎不是一个好的候选人,因为它需要在文本文件中保留一个munin节点的列表 – 对于stream量大的环境来说,这并不理想,而且每个节点运行的时间很短,我宁愿保留全分辨率的数据,也不愿意随着时间的推移使RRD数据下降。 最后,我的猜测是,这将需要一个监控引擎: 使用数据库(MySQL,SQLite等)进行configuration和数据存储 公开了用于添加/删除主机和服务的API 评估选项时,我应该考虑其他事情吗? 但是,也许我正在过度思考这个问题,而且应该每隔1分钟在这些短暂的实例上运行sar ,并在终止之前收集sar db文件。
如果我将下面的processor.max_cstate=0添加到启动的内核命令行,是否会禁用所有的CPU电源pipe理和调节? 我还发现: http : //www.experts-exchange.com/OS/Linux/Administration/A_3492-Avoiding-CPU-speed-scaling-in-modern-Linux-distributions-Running-CPU-at-full-speed- tips.html请 所有CPU /核心的链接都会将Change CPU调速器从“ondemand”改为“performance”,并从内核中禁用kondemand。 服务器用于虚拟主机 更新: 2.6.32-379.1.1.lve1.1.7.6.el6.x86_64 #1 SMP Sat Aug 4 09:56:37 EDT 2012 x86_64 x86_64 x86_64 GNU/Linux 。 # dmidecode 2.11 SMBIOS 2.6 present. 74 structures occupying 2878 bytes. Table at 0x0009F000. Handle 0x0000, DMI type 0, 24 bytes BIOS Information Vendor: American Megatrends Inc. Version: 1.0c Release […]
我把书和奴隶都放在书上。 我运行了初始LOAD DATA FROM MASTER; 在奴隶工作得很好。 但是,当我将数据插入到主机中时,根本不会被复制到从机。 我已经尝试重新启动主从机mysqld进程,以及从机上的“从机停止/从机启动”。 这是怎么回事? 主 configuration: server-id = 1 log_bin = /var/log/mysql/mysql-bin.log expire_logs_days = 10 max_binlog_size = 100M binlog_do_db = pchelp binlog_ignore_db = mysql binlog_ignore_db = test mysql> select * from pchelp.test_table; +—-+———+ | id | sometxt | +—-+———+ | 1 | x | | 2 | x | | […]
可能重复: 如何解决telnet服务器的“getaddrinfo:localhost名称或服务未find”? 我已经在AWS EC2实例上安装了一个新的Ubuntu 12.04,一切正常。 我遵循这个伟大的教程中的说明: http : //www.exratione.com/2012/05/a-mailserver-on-ubuntu-1204-postfix-dovecot-mysql/ 现在我在“安装监视”点,当我重新启动服务,我现在得到这个错误信息: monit: Cannot translate '(none)' to FQDN name — Name or service not known 我开始使用Google,并且有人在那里写信,monit在启动过程中使用getaddrinfo来确定主机名。 好的,所以我想我自己试试getaddrinfo是什么,然后我得到: getaddrinfo: command not found 我想,我的系统上缺less一些东西。 谁能帮忙?
NFSv3当然不支持ZFS ACL,但如果我有以下设置,会发生什么情况? +—————————————–+ +————-+ | FreeBSD ZFS serv1 | NFSv3 | Linux serv2 | | user1: read/write to /zfs/project1 | <——— | user1 | | user2: deny read/write to /zfs/project1 | | user2 | +—————————————–+ +————-+ 已经通过NFSv3在serv1和serv2上安装了ZFS ACL。 题 我假设uers1将能够读/写,因为这是NFSv3世界通常所做的事情。 但是user2会被拒绝吗?
我是新的serverfault,所以请告诉我的任何不良行为:) 我searchserverfault(和谷歌)的答案,但无法find我的问题的答案(我可以find答案,这部分是我需要的,但我缺乏知识/经验将他们结合到我的问题的解决scheme) 问题如下: – 我有一个公共服务器的端口81,这是公共IP地址可用 – 我有一个本地服务器端口80,这是公众不可用 – 我想用户连接到端口81上公共IP地址并到达本地服务器的端口80(192.168.98。###) 我想我需要使用iptables做一些configuration,但是对我来说这太雾了 我试过一些答案, 我怎么可以端口与iptables? 但是我遇到了各种各样的错误 一些问题: – 本地服务器是否有一些特殊的configuration? 例如,我必须将网关设置为公共服务器的IP地址? – / proc / sys / net / ipv4 / conf / ppp0不存在,是一个问题吗? 没有端口被防火墙阻塞 我有完全控制在运行的公共服务器: # cat /proc/version Linux version 2.4.22-1.2115.nptl ([email protected]) (gcc version 3.2.3 20030422 (Red Hat Linux 3.2.3-6)) #1 Wed Oct 29 15:42:51 EST 2003 # […]
我有一台Linux PXE服务器,用于在需要时在客户机上启动Clonezilla,Debian rescue等。 是否可以将Windows 7恢复CD(修复光盘)添加到此Linux PXE服务器上的可用系统上? 我不需要在networking上安装 Win7,而且我没有WDS服务器。 我发现的所有解决scheme都是完全安装的(比如这个或者这个 )。 我希望在包含以下文件的修复盘的情况下可以更简单: \ \boot\ bcd 262'144 bytes boot.sdi 3'170'304 bytes bootfix.bin 1'024 bytes \sources\ boot.wim 369'906'796 bytes bootmgr 383'786 bytes Linux PXE服务器也是一个Samba域控制器,以防有所作为。 当然也是DHCP服务器。
我正试图优化一组必须驻留在单机上的服务器。 即我可以有多个应用程序服务器,数据库服务器,当然还有一个桑巴服务器以及在同一个实例。 现在我正在研究几个可用的优化选项。 在我的追求中,我做了networking堆栈的调整。 来到CPU,内存和BLKIO的调整,我使用CGROUPS 。 我面临的问题是,为了增强我运行的应用程序的性能,为BLKIO子系统实现的CFQ计划程序不是最佳的。 我正在寻找更多的截止日程安排程序,因为这将有助于我的目的。 我的问题是我们是否有可能将BLKIO的内核编译本身的调度程序更改为截止时间,这将反映在我对[CGROUP层次结构] [3]的使用中? 因为当运行服务cgconf时,一个新的FS被挂载,我不希望它恢复到CFQ调度程序。 我也欢迎任何可以让我对自己的资源有更多控制权的build议。 编辑:我正在使用CentOS 6.2进行testing。 稍后将推出Redhat 6.2
我正在使用rsnapshot,我的configuration如下: config_version 1.2 snapshot_root /home/user/.snapshots/ cmd_cp /bin/cp cmd_rm /bin/rm cmd_rsync /usr/bin/rsync cmd_ssh /usr/bin/ssh cmd_logger /usr/bin/logger cmd_du /usr/bin/du cmd_rsnapshot_diff /usr/bin/rsnapshot-diff interval hourly 24 interval daily 7 interval weekly 4 verbose 2 loglevel 3 logfile /home/user/rsnapshot.log lockfile /home/user/rsnapshot.pid backup [email protected]:/home/user/ website/ backup_script [email protected]:/home/user/backup_mysql.sh website/mysql/ 我的sql备份文件:(故意留下来的东西) ### Setup dump directory ### BAKRSNROOT=/.snapshots/tmp ##################################### ### —-[ No Editing below […]
我现在iptables阻止所有的UDP通信,但是我想只允许某些DNS查询通过。 我们以google.com为例。 我正在尝试使用string匹配来查找请求中的域名,并允许它。 这是我想出来的。 iptables -A OUTPUT -o eth0 -p udp –sport 53 -m string –string "google.com" –algo bm -j ACCEPT 我也试过 – –dport 53而不是 – –sport 。 没有骰子。 如果有人知道如何做,或看看我错了哪里?