服务器问题集锦,包括 Linux(Ubuntu, Centos,Debian等)和Windows Server服务器
这里有一些有趣的问题/场景,有些系统pipe理员可能喜欢: 一个公寓业主正在赠送免费的互联网访问他的tennant。 基本上,他有一个T1来到大楼,每个公寓都有一个CAT5插头。 互联网接入是“免费的”(包括在租金或其他任何方面)的前端。 问题是,几个tentennts通过bittorrent下载非法电影/音乐。 因此,MPAA和RIAA正在向互联网连接的所有者(即公寓所有者)发送有关非法下载的“恶棍”。 该公寓的所有者已经阻止了洪stream网站的列表以及在路由器级别的几个文件扩展名,但问题依然存在。 我想知道的是,如果有人有这个问题的聪明/便宜的解决scheme? QoS显然只能工作到一定程度,因为bittorrent几乎可以使用任何想要的端口。 数据包检查不适用于encryption连接等。 公寓老板说,如果他能简单地看到单个公寓单位的上传/下载stream量(即潜在的滥用者),他会很高兴。 有任何想法吗? 更新:对讨论法律/律师/社会问题和实际的技术解决scheme(不pipe他们可能是什么)没有兴趣。 我恳请你们就法律/社会问题进行技术讨论。 谢谢! 回答:select贾斯汀·斯科特的答案是正确的答案,因为他build议使用托pipe交换机和MRTG。 虽然阻止BitTorrent或者至less使其极其困难,但MRTG和托pipe交换机将允许我们轻松识别违规者。
每天备份用户目录,24X7密码重置,启用ssh单点login,大量的存储空间,良好的testing环境,受控升级的HA群集,良好的编辑,最新的手册页,我仍然受到投诉。 那么,要让客户满意,有效和高效,需要做些什么? 最近的10个投诉 : 为什么在所有的服务器上都不安装模块PDF :: API2? 为什么我必须在HP服务器上使用LD_PRELOAD =? 为什么我的STL程序在运行AIX的站点上运行速度太慢? 在接下来的三个月里,我不能采取任何forms的停电。 为什么我的本地机器上没有编译器? 为什么昨天这个工作? Apache继续locking。 为什么我不能在生产中进行debugging? 为什么我不能只安装我需要的这个开源的东西? gunzip是如何被损坏的? 更新 :许多好的答案select。 我认为有一个暗示,要求是不愉快的客户的迹象,事实上,这是人们想要完成任务的标志。 这也是人们希望有效的基础,并且有足够的基础设施来支持他们的许多需求。 世界上所有的工具都不会让你知道最后5英寸,确保用户知道你在乎的是什么。
几个小时前,我的根分区已经满了,我把文件移开了,然后df报告: # df -h Filesystem Size Used Avail Use% Mounted on /dev/hda1 183G 174G 0 100% / 所以应该有9GB免费,但可用的报告0和使用仍然是100%。 我testing了根,例如 # echo test >a ; cat a test 它按预期工作; 然而作为一个普通的用户,我仍然得到错误: $ echo test >a ; cat a bash: echo: write error: No space left on device 我进行正面testing的根主目录和我的主目录在同一个分区上.fstab条目是: /dev/hda1 / ext3 noatime,defaults,errors=remount-ro 0 1
我正在运行gkrellm,它显示我的Debian Linux系统上的一些进程正在向eth0写入大约500KB / s。 我想找出它是哪个过程。 我对netstat有一点了解,但是它显示了一个巨大的TCP连接,我似乎无法让它产生任何关于stream量的信息。 有谁知道我怎样才能得到一个实际使用 eth0接口的进程列表,以便我可以追查到罪犯? 后续工作 :Debian Linux发行版包含一个nethogs包,可以明确地解决这个问题。 相关的工具,如iftop , netstat和lsof ,都不是很清楚。
我有一个物理机主机上运行的虚拟机(Debian)。 虚拟机作为它经常在本地networking上接收的数据的缓冲区(这个数据的周期是0.5s,因此吞吐量相当高)。 收到的任何数据都存储在虚拟机上,并通过UDP重复转发到外部服务器。 一旦外部服务器(通过UDP)确认已收到数据包,原始数据将从虚拟机中删除,而不会再次发送到外部服务器。 连接虚拟机和外部服务器的互联网连接是不可靠的,这意味着它可能一度停机数天。 托pipe虚拟机的物理机器随机每天多次切断电源。 没有办法知道何时会发生这种情况,并且不可能为系统添加UPS,电池或类似的解决scheme。 最初,数据存储在虚拟机上基于文件的HSQLDB数据库上。 然而,频繁的停电最终会导致数据库脚本文件被破坏(不在文件系统级别,即可读,但HSQLDB无法理解),这导致了我的问题: 数据应该如何存储在一个断电的环境中,并经常发生? 我能想到的一个select是使用平面文件,将每个数据包作为文件保存在文件系统上。 这样,如果文件由于断电而损坏,则可以忽略,其余数据保持不变。 然而,这带来了一些问题,主要与可能存储在虚拟机上的数据量有关。 在每个数据之间0.5秒时,10天内将生成1,728,000个文件。 这至less意味着使用具有增加数量的inode的文件系统来存储这些数据(当前的文件系统设置在约250,000条消息和30%的磁盘空间使用inode)。 而且,很难(不可能)pipe理。 还有其他的select吗? 是否有在Debian上运行的数据库引擎不会因为停电而被破坏? 另外,应该使用什么文件系统? ext3是目前使用的。 在虚拟机上运行的软件是使用Java 6编写的,所以希望解决scheme不会不兼容。
我们遇到了一个奇怪的行为,我们看到高CPU利用率,但平均负载很低。 我们的监测系统中的下列图表可以很好地说明这一现象。 在大约11:57,CPU利用率从25%上升到75%。 平均负载没有显着变化。 我们运行12个核心的服务器,每个都有2个超线程。 操作系统认为这是24个CPU。 通过每分钟运行/usr/bin/mpstat 60 1来收集CPU利用率数据。 all行和%usr列的数据如上图所示。 我确信这确实显示了每个CPU数据的平均值, 而不是 “堆积”利用率。 虽然我们在图表中看到75%的利用率,但是我们看到一个过程显示使用大约2000%的“堆叠式”CPU。 平均负载数字取自/proc/loadavg每分钟。 uname -a给出: Linux ab04 2.6.32-279.el6.x86_64 #1 SMP Wed Jun 13 18:24:36 EDT 2012 x86_64 x86_64 x86_64 GNU/Linux Linux dist是Red Hat Enterprise Linux Server release 6.3 (Santiago) 我们在相当重的负载下运行一些Java Web应用程序,认为每台机器100个请求/秒。 如果我正确解释CPU利用率数据,当我们有75%的CPU使用率时,这意味着我们的CPU平均在75%的时间内执行一个进程。 但是,如果我们的CPU占用75%的时间,我们不应该看到更高的平均负载吗? 如何在运行队列中只有2-4个作业的情况下CPU占用率达到75%? 我们是否正确解释我们的数据? 什么会导致这种行为?
这显然是一个更快的连接降低延迟…但我想知道:我正在远程工作在世界的另一端主机 – 光只能走得这么快(1英尺纳秒),我们都有宽带连接超过1,000kbps上传和10,000kbps下载: 一个更高的带宽连接会降低ping时间吗? 由于数据非常less,所以快速连接将如何提供帮助? 目前ping需要450ms有没有什么办法可以改善呢?
一直在研究RedHat框的一些安全强化程序,我想知道是否可以防止用户在密码过期后更改密码。 对于我们的客户之一,要求他们只能通过临时账户访问服务器,这意味着一旦创build了用户凭证,密码必须在4小时内过期,一旦密码过期,只有root可以更改。 对于第一个要求(密码在4小时后过期),我想可以通过设置passwordMaxAge = 144000来实现。 但是我仍然找不到防止更改过期密码的用户的方法,而不必closures密码过期。 谁能帮忙?
我有一个客户端正在大量垃圾邮件..这是本月15日和POP3带宽几乎100 GB。 这个域只有7个电子邮件帐户。 我安装SpamAssassin将其设置为5,并设置10-20filter拒绝大部分的垃圾。 我没有看到很多POP3带宽的变化。 纠正我,如果我错了,服务器仍然收到消息使用带宽,以分析确定垃圾邮件分数。 我偶然发现了假冒MXlogging,因为没有意识到 – 基本上你把一个假的服务器设置为最低和最高的MXlogging,中间有工作服务器的MXlogging。 例如: fake.example.com 1 realmx.example.com 2 fake2.example.com 3 理论上说,因为大部分垃圾邮件都是基于Windows的僵尸产生的,而且有不less人会查询到最高的垃圾邮件logging,因为通常他们通常是不过滤垃圾邮件的备份服务器。 最低的假MXlogging是垃圾邮件发送者的其余部分..通常垃圾邮件发送者不会在失败后重试。 有没有人试过这个? 它有帮助吗? 邮件传递是否延迟或导致问题? 其他人有更好的解决scheme吗?
我怎样才能grep PS输出的头文件? 这两个过程组成了我的服务器上运行的应用程序…. root 17123 16727 0 16:25 pts/6 00:00:00 grep GMC root 32017 1 83 May03 ? 6-22:01:17 /scripts/GMC/PNetT-5.1-SP1/PNetTNetServer.bin -tempdir /usr/local/GMC/PNetT-5.1-SP1/tmpData -D 6-22:01:17是不是已经跑了6天了? 我正在努力确定进程已经运行了多长时间… 第二列是进程ID吗? 所以如果我kill 32017它会杀死第二个进程?