问题开始 – 我的PID很less消耗100%的CPU,我想了解哪个脚本正在执行该PID命令。 我的debugging步骤: strace ps -ef 打开(“/ proc / PID /状态”,O_RDONLY)= 6读取(6,“名称:\ textract \ n状态:\ tR(运行)”…,1023)= 1023closures(6)= 0打开/ proc / PID / cmdline“,O_RDONLY)= 6 read(6, 所以试图打开/ proc / PID / cmdline卡住了 我试过了,它又卡住了 有些东西显然是在内核中,请让我知道你的build议或下一个debugging步骤 注:关机不起作用,如果我手动关机,问题再次启动。 ps:因为我的名声,我无法聊天。 请随时询问任何build议命令的输出,我会尽快将其粘贴!
从debian 2.6.32-openvz-amd64升级到RHEL6 2.6.32-042stab035.1后,内核页面caching问题。 看起来像没有OpenVZ容器使用页面caching,现在我有10-15GB的可用RAM和只有3-5GBcaching生成的MySQL服务器上运行VE0。 debian内核没有这样的问题,但是我尝试过的所有RHEL6内核都有相同的思想。 MemTotal: 24677212 kB MemFree: 10462364 kB Buffers: 467596 kB Cached: 6487520 kB SwapCached: 0 kB Active: 9149776 kB Inactive: 3396248 kB 任何想法与RHEL6内核发生了什么? 我怎么能让容器使用caching?
上周,一个用户应用程序变成了我的一台服务器。 这是逐渐和缓慢地耗尽记忆。 当我试图kill -9 PID ,PID进入state D 虽然这是吃服务器的内存,这是迄今为止最需要内存的过程,我决定尝试替代方法 – 使用OOM_Killer。 所以,我增加了oom_adj到15,这个PID的oom_score跳了起来。 但是,OOM_Killer没有采取行动。 我有几个问题: 如果SIGKILL不行,OOM_Killer会杀死一个进程吗? OOM_Killer运行的可用内存量是多less(在可用内存less于X的地方执行)? 是否等到可用内存达到内核预留的内存(64KB IIRC)? 如何从OOM_Killer中受益,手动调用它还是迫使它运行得更快? 只是为了logging – 服务器是Ubuntu 9.10,内核2.6.31。 谢谢!
编辑 :几个小时后,我发现这个问题与桉树无关。 它看起来像图像是越野车。 非常, 非常多 。 更多细节到底。 我没有设法解决它,我会提交一个错误。 编辑2 :我设法修复它,它显然工作。 我有一台运行Ubuntu Server Natty(11.04)x64的4台机器群集。 我已经从installtion光盘上安装了“Ubuntu Enterprise Cloud”(然后在每台机器上进行更新)。 云似乎工作正常,我有很多虚拟机上运行Natty服务器。 现在我想在虚拟机上运行Oneiric,但不知怎的,我不能。 我从http://cloud-images.ubuntu.com/oneiric/current/下载了Oneiric的(x64)映像,发布了它( uec-publish-tarball oneiric-server-cloudimg-amd64.tar.gz oneiric-server-cloudimg-amd64 )和我一样,然后尝试使用Oneiric的图像启动一个实例( euca-run-instances -n 1 -k my-key -t m1.small -z my-cloud emi-XXXXXXXX ),但是实例无法启动。 随着euca-get-console-output我得到以下内容: [ 0.461269] VFS: Cannot open root device "sda1" or unknown-block(0,0) [ 0.462388] Please append a correct "root=" boot option; here […]
我读了一些关于TIME_WAIT连接,并知道他们应该对我的服务器无害(连接closures,所以没有资源连接到此套接字)。 最近,我的服务器在TIME_WAIT状态达到了60k个端口的魔术数字; 我想知道我是否会用完免费的端口? 我的服务器使用内核中设置的dynamic本地端口: # sysctl net.ipv4.ip_local_port_range net.ipv4.ip_local_port_range = 32768 61000 当创build一个新的连接时,它会使用其中一个TIME_WAIT端口吗? 或尝试绑定一个不同的,开放的端口? 如果我把这个variables设置到端口1024-65535,如果我有一些应用程序在该范围内的端口上运行,会发生什么? 这不是一个如何最小化TIME_WAIT连接状态的问题。 当前的内核修改 : # sysctl net.ipv4.tcp_tw_recycle net.ipv4.tcp_tw_recycle = 0 # sysctl net.ipv4.tcp_tw_reuse net.ipv4.tcp_tw_reuse = 1 # sysctl net.ipv4.tcp_fin_timeout net.ipv4.tcp_fin_timeout = 30 # sysctl net.ipv4.tcp_timestamps net.ipv4.tcp_timestamps = 1 # sysctl net.ipv4.tcp_sack net.ipv4.tcp_sack = 1
我正在Amazon EC2实例中运行Ubuntu 10.04 LTS。 系统突然变得没有反应。 当我检查日志文件时,我在/ var / log / syslog中发现了以下错误 2月22日04:10:01 ip-10-0-1-12 CRON [16153] :(根)CMD(/ usr / sbin / cm-sysmon)^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ […]
升级到最新的OpenVZ内核后,CentOS服务器将无法启动。 当我尝试去引导最新的内核服务器卡住在这一点:(注意,图像是从虚拟kvm采取) 然后,我尝试启动服务器上的一些旧的内核,比我得到这个错误消息: kernel panic – not syncing – attempted to kill init 更好的显示在这张图片上: 这里有一些有用的信息 fdisk -l WARNING: GPT (GUID Partition Table) detected on '/dev/sda'! The util fdisk doesn't support GPT. Use GNU Parted. Disk /dev/sda: 2995.7 GB, 2995739688960 bytes 255 heads, 63 sectors/track, 364211 cylinders Units = cylinders of 16065 * 512 = 8225280 […]
所以,我们的软件可能会有某种程度的漏洞。 我们正在使用Mono,并在几个星期/几个月的时间内产生许多进程。 最终,我们不能在我们的客户机器上产卵。 通常需要20个小时才能停止。 closures并重新打开我们的应用程序修复它。 当产卵失败时,整个系统运行的总进程less于500个,并且在整个系统上less于1000个文件句柄。 ulimits文件被设置为高ISH水平,我相信过程限制是8K左右。 我们正在运行CentOS 6.2。 如果我们正在泄漏这些PID或句柄,标准的ps和lsof命令只是不显示它们(都不是/ proc),我需要一种方法来挖掘内核或其他东西,看看目前的值是什么限制testing。 一旦我们确认了这个问题,我就可以尝试破译造成这件事情的有趣任务了…但是那又来了一天。 据我们所知,这个应用程序在许多许多其他的Linux机器上工作,没有任何问题(其他客户没有向我们报告这个问题)。 任何想法,我怎么能findulimit设置的指标的价值? 我拼命地希望自己不必编写C程序,但是如果有必要的话,我还没有做过。
我有一个现在升级到12.04 LTS服务器的Ubuntu服务器。 自从我从10.10升级到11.04之后,当内核从2.6.38升级到3.0时,我的机器会不停地随机重启大约2-3分钟。 无论是闲置还是我做了什么,都会随机重启。 现在如果我在11.04或11.10或事件12.04中select了2.6.38的旧内核,它将是坚如磐石,没有任何抱怨。 但是,如果我执行任何需要重新启动的更新,我总是会testing新的内核版本是否能解决导致随机重新启动的问题。 现在升级到12.04和3.2内核,我真的希望所有的东西都能解决,但是令我失望的是,它仍然在进行随机重启。 不过,我认为12.04有一个新的function,提供了一个线索的根本原因。 我有一个屏幕报告错误,因为它报告“colord”守护进程导致与SIGSEGV消息崩溃。 所以,如果有人有同样的问题,这是一个长远的目标,因为我过去一年search这个东西没有用。 我不想重build盒子,因为我所要做的就是回到2.6内核,一切正常。 欣赏任何input!
我试图了解是否在Solaris 10上报告的高陷阱数 内核:1659 ctxsw, 1069 trap ,4433 intr,3837 syscall,5 fork内存:8192M物理内存,299M空闲内存,总共4103M交换,3236M免费交换 是否有问题。 谷歌陷阱谷歌search主要返回内核架构上的大文件; 悬崖笔记将不胜感激。 谢谢 PS。 没关系交换