服务器问题集锦,包括 Linux(Ubuntu, Centos,Debian等)和Windows Server服务器
上周我一直在加载。 这通常每天发生一次或两次。 我已经设法从iotop确定[jbd2 / md1-8]正在使用99.99%的IO。 在高负载时间内,服务器没有高stream量。 服务器规格是: AMD Opteron 8核心 16 GB RAM 2×2.000 GB 7.200 RPM硬盘软件RAID 1 Cloudlinux + Cpanel Mysql正确调整 除了尖峰,负载通常最多在0.80左右。 我search了一下,但无法find[jbd2 / md1-8]究竟做了什么。 有没有人有这个问题或有没有人知道一个可能的解决scheme? 谢谢。 更新: TIME TID PRIO USER DISK READ DISK WRITE SWAPIN IO COMMAND 16:05:36 399 be/3 root 0.00 B/s 38.76 K/s 0.00 % 99.99 % [jbd2/md1-8]
昨天我做了一些很愚蠢的事情。 我编辑了我的nginx服务器的configuration文件,丢弃了一些设置,并且在我保存了文件之后,我意识到我正在编辑错误的文件。 现在我没有重新加载服务器,所以它仍然在运行旧的configuration。 我想知道是否可以显示服务器正在运行的当前configuration。
每次我在2012 Datacenter中打开Internet信息服务pipe理器时,系统都会提示您安装Microsoft Web Platform以“保持与最新Web平台组件的连接”。 我曾经在网上嗅探过,但我无法理解那个平台可能会为我做什么,也不知道为什么我会被提示安装它。 在我看来,我已经安装了一切,Web平台安装程序将安装即IIS? 为什么我被提示安装东西/垃圾我不明白在服务器机器上?
我已经在我的控制下的服务器上安装了由Debian打包的fail2ban。 由于我有一些以前的失败返回,我将它们放到本地filter定义文件中,这样它们也会被考虑。 因此,我结束了例如/etc/fail2ban/filter.d/sshd.conf和/etc/fail2ban/filter.d/sshd.local。 这是build议build立的方式 ,它似乎正在工作就好了。 但是,在.local文件中,我实际上是从.conf文件中replace了failregexes的整个列表。 该文档似乎并没有表明有任何其他的方式来做到这一点,我只是简单地将分发提供的.conf文件复制到一个.local文件,并做了一些补充。 如果我可以简单地修改这个列表,那么上游和Debian维护者的工作将会受益于分布式维护的日志条目filter正则expression式的变化。 我能想到的唯一真正的解决方法是实际创build两个jail,一个使用发行版提供的configuration,另一个使用我自己的configuration。 这似乎有一个(相当重要的)缺点,他们被视为独立的监狱(你期望与这样的设置)。 当然,我不可能是唯一一个想把我自己的一些失败软件join到已经存在的集合中,而且维护起来最less的麻烦。 是否可以通过站点本地或主机本地文件修改 fail2banfilter定义中的failregex和ignoreregex列表,而不对相应的全局或分发提供的文件进行任何更改? 如果是,那该怎么办呢?
在Postfix 2.10.2中,我有一个安装了多个域和几个虚拟别名的邮件地址给本地用户。 只要我不添加一个catchall它工作正常。 在使用虚拟别名之前,我已经定义了一个catchall local_recipient_maps = luser_relay = catchall 但是因为我需要从不同的域中分离邮件地址,所以我不得不使用虚拟别名。 现在postfix.org说我应该这样做,我做了: /etc/postfix/main.cf文件: virtual_alias_domains = example.com virtual_alias_maps = hash:/etc/postfix/virtual /等/后缀/虚拟: [email protected] account1 [email protected] account1 [email protected] account2 @example.com catchall 但是如果我这样做了,那么这个地址抓取所有的邮件,而不是邮件,而不是明确定义的地址。 为什么是这样的,如何改变它? 我没有postmap虚拟,也重新启动Postfix。 日志中没有错误,它只是将交付日志logging到catchall地址。 并且有一个警告“不要在mydestination和virtual_alias_domains中列出域example.com”,但我没有这样做! 我甚至没有一个mydestination指令。 (在下面的configuration中有一个,但是我在NickW之后build议如此。) 这是我完全的conf: alias_database = hash:/etc/aliases alias_maps = hash:/etc/aliases append_dot_mydomain = no biff = no broken_sasl_auth_clients = yes config_directory = /etc/postfix home_mailbox = […]
我非常喜欢Monit系统pipe理系统,但是我没有IT预算购买用于pipe理我们小型大学实验室的多个主机的M / Monit接口。 我已经检查了基于Ruby的monittr ,我发现Django人正在做一些东西。 任何人都可以给我一些简单的包装的build议,可以帮助我从多个服务器拉动信息? 编辑:这个问题是如何重复的? 我不是在问监控工具。 在过去的两周里,我估计大概有六打了。 我正在问一个非常具体的问题,关于一个非常具体的监测工具。 我承认,尽pipe这可能是不愉快的,但我从ewwhite收到的评论是一个有效的观察。
我去年build立了一个Windows 2008 R2服务器,自从我的帐号每天locking10-12次以来。 经过大量研究和testing,我发现服务器在每次尝试更新组策略失败时都会locking我的帐户(大约每90分钟一次)。 我发现网上没有任何信息表明其他人看到了这一点,我自己也觉得不可思议。 每次在服务器上logging3个系统事件: 事件ID 14:存储在Credential Manager中的密码无效。 这可能是由用户从这台计算机或另一台计算机更改密码引起的。 要解决此错误,请在“控制面板”中打开Credential Manager,然后重新input凭证contoso \ me的密码。 凭证pipe理器中没有条目。 无论是否禁用凭证pipe理器服务,无论是否login,是否注销并使用本地pipe理员帐户删除我的configuration文件,都会发生这种情况。 事件ID 40960:安全系统检测到服务器cifs / ContosoDC.contoso.com的身份validation错误。 validation协议Kerberos的失败代码是“用户帐户已被自动locking,因为已经请求了太多无效的login尝试或密码更改尝试(0xc0000234)”。 – 事件ID 1058: 组策略的处理失败。 Windows尝试从域控制器读取\ contoso.com \ SysVol \ contoso.com \ Policies {78719F0C-3091-4B5C-9BC3-6498F729531E} \ gpt.ini文件,但未成功。 在解决此事件之前,可能不会应用组策略设置。 此问题可能是暂时的,可能是由以下一项或多项原因造成的:a)名称parsing/networking连接到当前域控制器。 b)文件复制服务延迟(在另一个域控制器上创build的文件尚未复制到当前的域控制器)。 c)分布式文件系统(DFS)客户端已被禁用。 我检查了项目ac,似乎没有这样的情况。 我已经通过检查用户帐户没有被locking,在服务器上运行gpupdate,然后重新检查立即locking的用户帐户进行了彻底的testing。 我已经使用locking工具来揭示所有的locking来自这个特定的服务器。 用户帐户没有关联的电子邮件地址,我已经广泛研究了已知locking问题的常见arrays。 任何线索对我来说? 我正在准备取消这个生产服务器,并在AD中重置它的计算机对象,但我不知道这会有所帮助。
我有一台服务器2012r2机器,我刚刚安装了KB2919355(最近发布的Windows 8.1和Server 2012的800 + MB补丁)。 服务器是戴尔Poweredge R715。 磁盘是在H200控制器上的RAID1中的2x500GB SAS。 服务器工作正常,直到更新 – 我已经安装了戴尔pipe理工具,所以我知道没有失败的磁盘警报或任何东西。 在升级H200控制器的固件前一天,系统重启之后没有任何问题。 重新启动更新后,它出现了一个黑色的屏幕,可移动的鼠标光标,但没有别的 – Ctrl-Shift-Esc和Ctrl-Alt-Del什么都不做。 让它坐在那里一个多小时,没有什么改变。 用“不要自动重新启动BSOD”选项启动,并获取INACCESSIBLE_BOOT_DEVICE作为错误原因。 奇怪的是,它说:“我们只是收集一些错误信息,然后你可以重新启动(0%完成)”,并保持在0%,从来没有取得任何进展。 试图用最后一次正确的configuration重启,同样的BSOD。 重启进入修复我的电脑工作。 从命令提示符我可以看到所有的分区和所有的文件似乎是完好无损的。 chkdsk报告没有错误。 在此之后,服务器设法正常启动一次。 重新启动后,尽pipe重复启动尝试,它也不会恢复,但它们都以INACCESSIBLE_BOOT_DEVICE蓝色屏幕结束。 这个问题似乎与LSI RAID控制卡有关。 technet上有一个关于报告其他与超微机器有类似问题的post – http://social.technet.microsoft.com/Forums/en-US/6bf5815f-55d9-4403-8f41-a16ebcb83735/patch-kb2919355-makes-超微机器死机?论坛= winserver8setup 戴尔正在尝试在他们的实验室中复制此问题。 这里可能没有其他人可以做。 更新 在戴尔的build议下,我擦了擦系统,并用GUI重新安装了Server 2012R2 Datacenter。 除了安装Windows更新,我什么也没做。 安装KB2919355后,服务器正常重启。 再次重新启动后,会用INACCESSIBLE_BOOT_DEVICE错误进行蓝屏。 强烈build议不要在基于LSI的RAID卡的任何服务器上安装此更新,直到解决此问题。 希望戴尔能够快速提出解决scheme。 从戴尔支持更新 这是一个我们现在正在更大规模地考虑的问题,很可能将不得不由微软来解决,因为它比戴尔更广泛。 我们将继续努力,直到资源枯竭。 我会告诉你我们发现的东西。 戴尔支持的另一个更新 戴尔一直无法在他们的实验室中复制这个问题。 我已经确认2我的系统有相同的问题,并重现它很容易 – 安装Windows,安装更新,直到它给你KB2919355,服务器在安装更新后第二次重新启动死亡。 目前他们正在build造一台交换机来交换其中的一台,所以他们有一台破碎的机器去testing。 希望能够帮助他们迅速解决问题。
从Ubuntu桌面x64 14.04 ssh客户端连接到Ubuntu服务器14.04 x64 Microsoft Azure上的SSH服务器。 不幸的是,当它连接并闲置一段时间时, 连接冻结但不断开。 我已经尝试在我的服务器的/etc/ssh/sshd_config设置这些variables: ClientAliveInterval 30 TCPKeepAlive yes ClientAliveCountMax 99999
在CentOS 6.5上,在/etc/pki/tls/certs我有: ca-bundle.crt 和 ca-bundle.trust.crt 具有不同的文件大小。 我应该使用哪一个作为nginx proxy_ssl_trusted_certificate的信任path。