我已经花了数百小时试图追踪一个在64位CentOS 5上以随机间隔神秘结束的进程的原因,至今我还没有接近理解原因。 我们查看了OOM杀手,查看了所有可能的日志文件,在事件发生之后在服务器上完成了深度postmortems,添加了debugging代码以触发任何“exception”终止事件的核心转储等。 有问题的进程正常启动,并且经常在给定的服务器上长时间运行(数天,数周,有时甚至更长),但在随机服务器上以随机间隔运行,没有明显的因果关系,只会退出。 没有日志,没有核心文件,没有任何东西。 我不知道接下来要做什么 – 希望得到一些我没有想到的故障排除的想法。
按照本指南,我已经在ubuntu 14.04上build立了一个包含tls的openldap服务器。 在testing连接的时候,我得到了我找不到解释的结果。 ldapsearch -xLLL -Z -W -D cn=admin,cn=config -b cn=config cn=config 结果是 dn: cn=config objectClass: olcGlobal cn: config olcArgsFile: /var/run/slapd/slapd.args olcLogLevel: none olcLogLevel: stats olcPidFile: /var/run/slapd/slapd.pid olcTLSCACertificateFile: /etc/ssl/certs/cacert.pem olcTLSCertificateFile: /etc/ssl/certs/ldap01_slapd_cert.pem olcTLSCertificateKeyFile: /etc/ssl/private/ldap01_slapd_key.pem olcToolThreads: 1 如预期。 但增加debugging级别 ldapsearch -d 2 -xLLL -Z -W -D cn=admin,cn=config -b cn=config cn=config 结果是 ldap_write: want=31, written=31 0000: 30 1d […]
我有一个for循环我用来停止和开始数量的开发服务器这里是一个例子。 for i in `cat hosts` ; do ssh $i -i .ssh/key.key -t sudo /etc/init.d/jboss-as start ; done 这将连接到每个盒子,并停止服务,我必须等待在这种情况下closures服务的操作“jboss”之前,连接到其他箱子。 有没有办法可以执行请求并退出而无需等待完成? 谢谢
我们有一个需要填写的内容,那就是通过SSH协议每天给我们报告所有的变化(以及谁做的变化) 无论是文件还是数据库资源。 监视数据库操作是没有问题的,因为每秒我们有大约4000个查询,而每个logging只是为了捕获来自某个用户或主机的查询而需要一些计划。 但是可以这样做,所以我没关系。 我们有几个高级开发人员由于各种原因而ssh访问生产Web服务器。 可以使用VIM或其他常见的文本编辑器(如Pico)编辑文件,但是可以使用部署系统。 在这个部署过程之外,我们需要监视和报告Web环境何时被修改。 我们的网页目录结构中充满了超过5,000,000个不同的文件和文件夹,有些目录中有很多文件,命令“ls”打破或者简单地挂起。 这是一个inheritance的CRM系统,但它的生产。 出于这个原因,诸如ossec隐藏,inotify或其他系统/文件监视过程的实用程序将需要大量资源用于实时监视和通知。 而不是监视文件系统,应该可以简单地监视用户,并监视他们何时访问定义的path中的文件或目录,并logging他们所做的更改。 至于要求,我们需要每天提交一份日常的文件和数据库变更报告(通过ssh),如果需要的话,会产生什么样的变化(a前后)。 Linux的命令实用程序“脚本”几乎给我们的重播,除了它不喜欢在用户打开某些程序(vim等)时工作。 另一种logging方法是必要的。 我很惊讶没有一个真正的基于terminal的用户监控解决scheme的真正的软件包, 完成目录path跟踪,资源访问,带时间滑块的修改,可由主机或用户过滤的事件历史logging(local / ldap / etc)。 或者…有一个吗?
我的服务器随机挂起,没有任何日志logging(dmesg,syslog,kern.log,boot.log和消息)变得没有响应。 我无法预测什么时候会发生。 有时服务器运行良好数月,突然间又开始发生。 在上个星期发生了8次以上。 这种情况已经发生了一年多了。 内核日志总是一样的: Jan 24 03:20:34 voyager dnsmasq-dhcp[4476]: DHCPREQUEST(br100) 192.168.145.3 fa:16:3e:4e:e0:d5 Jan 24 03:20:34 voyager dnsmasq-dhcp[4476]: DHCPACK(br100) 192.168.145.3 fa:16:3e:4e:e0:d5 viaapp Jan 24 03:20:37 voyager dnsmasq-dhcp[4476]: DHCPREQUEST(br100) 192.168.145.9 fa:16:3e:62:09:86 Jan 24 03:20:37 voyager dnsmasq-dhcp[4476]: DHCPACK(br100) 192.168.145.9 fa:16:3e:62:09:86 web-sistemas Jan 24 03:20:38 voyager dnsmasq-dhcp[4476]: DHCPREQUEST(br100) 192.168.145.16 fa:16:3e:79:dd:f8 Jan 24 03Jan 24 03:22:47 voyager kernel: […]
我一直在网上寻找源代码,但一直没有find关于Badblocks的官方文档 – 这是标准e2fsprogs的一部分。 我正在使用Badblocks来validation我购买的新驱动器,并且输出总是在: 阅读错误 写错误 比较错误 Badblocks将数据写入扇区,然后返回并检查它是否正确写入,对所涉及的所有内容进行testing。 当写入的数据与读取的数据不匹配时,popup比较错误。 我的问题是 – 究竟是一个“读取错误”,究竟是什么“写入错误”? Badblocks如何确定这些故障? 新驱动器和旧驱动器可接受的阈值是多less?
我的问题是我试图在服务器上设置tftp,所有东西都运行正常exept当我试图从tftp下载文件它从来没有响应,没有任何错误,我看到,只是沉默,当我嗅到从应该响应的服务器的stream量,我看到请求但服务器从来没有回应的文件 我正在用Fedora 17运行一台电脑(我知道这是生命的尽头,但是这个时候是不可改变的) 我试图让tftp运行在它上面,我安装了tftp( yum install -y tftp-server )并设置为运行,打开了UDP端口69 ,并设置了文件夹的权限,但是没有任何响应,这里是一些输出和configuration文件 当我运行tftp [服务器的ip]得到testing 任何帮助将不胜感激 SELinux : # setenforce 0 setenforce: SELinux is disabled tftp config : cat /etc/xinetd.d/tftp # default: off # description: The tftp server serves files using the trivial file transfer \ # protocol. The tftp protocol is often used to boot diskless \ […]
在Debian Linux稳定版本中,当前和稳定版本之间总是存在滞后。 因此,Clamav软件包中的一个对此非常嘈杂,并且日志文件充满了: WARNING: Your ClamAV installation is OUTDATED! WARNING: Local version: 0.98.5 Recommended version: 0.98.6 DON'T PANIC! Read http://www.clamav.net/support/faq 我正在使用监视软件包Logwatch,并将所有这些发送到我的电子邮件。 有没有办法阻止freshclam写这个警告logging或从Logwatch中跳过?
我们在centos 6上使用nginx,从这里使用init.d脚本: https : //gist.github.com/sairam/5892520/raw/b8195a71e944d46271c8a49f2717f70bcd04bf1a/etc-init.d-nginx 这一切“有用” Nginx运行等 但是,在某些情况下,通过ssh使用这个init.d脚本之后,通过ssh和作为控制台的root脚本,这个脚本看起来只能工作。 例如 service nginx stop [OK] 但是nginx仍在运行…. service nginx restart [OK] 但服务运行相同的PID,并没有退出。 重新启动框似乎是正确获取服务停止和重新启动的唯一方法。 完整的步骤和问题如下所示。 我如何解决这个问题? 在这里,我以sysadmin身份login,然后运行命令: 在这里,我只是以root用户身份login。 同样的问题:
我只是想说,我还在学习linux,并没有太多的经验。 我的工作要求我监视正在运行我们产品的客户主机的警报系统。 我刚刚收到一个关于NTP的警告,让我困惑了一下,所以我希望这里有人能帮我澄清一下。 警报是针对特定主机的NTP偏移。 这很好,只要去重新同步到NTP服务器。 但是,事实certificate,在configuration文件中没有定义NTP服务器,甚至在我停止时甚至没有运行: "ntpd: unrecognised service" 但是,这项检查已经运行了一段时间,只有今天才会提醒。 所以我的问题是,如果没有为该主机定义NTP服务器,NTP甚至没有运行,什么触发了警报? 我的意思是,如果警报只在偏移很大的时候才会closures,如果没有定义的服务器被比较,怎么会有偏移呢? 警报甚至以秒为单位指定确切的时间,并且正在更新。 所以这是比较自己的东西,对吧? 我试图在网上寻找答案,但没有任何东西与我点击。 任何帮助将是伟大的。