内核服务器 Gind.cn

build议需要debugging为什么ps -ef卡住了

问题开始 – 我的PID很less消耗100％的CPU，我想了解哪个脚本正在执行该PID命令。我的debugging步骤： strace ps -ef 打开（“/ proc / PID /状态”，O_RDONLY）= 6读取（6，“名称：\ textract \ n状态：\ tR（运行）”…，1023）= 1023closures（6）= 0打开/ proc / PID / cmdline“，O_RDONLY）= 6 read（6，所以试图打开/ proc / PID / cmdline卡住了我试过了，它又卡住了有些东西显然是在内核中，请让我知道你的build议或下一个debugging步骤注：关机不起作用，如果我手动关机，问题再次启动。 ps：因为我的名声，我无法聊天。请随时询问任何build议命令的输出，我会尽快将其粘贴！

OpenVZ与RHEL6内核和页面caching？

从debian 2.6.32-openvz-amd64升级到RHEL6 2.6.32-042stab035.1后，内核页面caching问题。看起来像没有OpenVZ容器使用页面caching，现在我有10-15GB的可用RAM和只有3-5GBcaching生成的MySQL服务器上运行VE0。 debian内核没有这样的问题，但是我尝试过的所有RHEL6内核都有相同的思想。 MemTotal: 24677212 kB MemFree: 10462364 kB Buffers: 467596 kB Cached: 6487520 kB SwapCached: 0 kB Active: 9149776 kB Inactive: 3396248 kB 任何想法与RHEL6内核发生了什么？我怎么能让容器使用caching？

如果SIGKILL没有，OOM_Killer会成功吗？

上周，一个用户应用程序变成了我的一台服务器。这是逐渐和缓慢地耗尽记忆。当我试图kill -9 PID ，PID进入state D 虽然这是吃服务器的内存，这是迄今为止最需要内存的过程，我决定尝试替代方法 – 使用OOM_Killer。所以，我增加了oom_adj到15，这个PID的oom_score跳了起来。但是，OOM_Killer没有采取行动。我有几个问题：如果SIGKILL不行，OOM_Killer会杀死一个进程吗？ OOM_Killer运行的可用内存量是多less（在可用内存less于X的地方执行）？是否等到可用内存达到内核预留的内存（64KB IIRC）？如何从OOM_Killer中受益，手动调用它还是迫使它运行得更快？只是为了logging – 服务器是Ubuntu 9.10，内核2.6.31。谢谢！

无法在Eucalyptus上启动Oneiric x64实例

编辑：几个小时后，我发现这个问题与桉树无关。它看起来像图像是越野车。非常，非常多。更多细节到底。我没有设法解决它，我会提交一个错误。编辑2 ：我设法修复它，它显然工作。我有一台运行Ubuntu Server Natty（11.04）x64的4台机器群集。我已经从installtion光盘上安装了“Ubuntu Enterprise Cloud”（然后在每台机器上进行更新）。云似乎工作正常，我有很多虚拟机上运行Natty服务器。现在我想在虚拟机上运行Oneiric，但不知怎的，我不能。我从http://cloud-images.ubuntu.com/oneiric/current/下载了Oneiric的（x64）映像，发布了它（ uec-publish-tarball oneiric-server-cloudimg-amd64.tar.gz oneiric-server-cloudimg-amd64 ）和我一样，然后尝试使用Oneiric的图像启动一个实例（ euca-run-instances -n 1 -k my-key -t m1.small -z my-cloud emi-XXXXXXXX ），但是实例无法启动。随着euca-get-console-output我得到以下内容： [ 0.461269] VFS: Cannot open root device "sda1" or unknown-block(0,0) [ 0.462388] Please append a correct "root=" boot option; here […]

TIME_WAIT会影响dynamic端口吗？

我读了一些关于TIME_WAIT连接，并知道他们应该对我的服务器无害（连接closures，所以没有资源连接到此套接字）。最近，我的服务器在TIME_WAIT状态达到了60k个端口的魔术数字; 我想知道我是否会用完免费的端口？我的服务器使用内核中设置的dynamic本地端口： # sysctl net.ipv4.ip_local_port_range net.ipv4.ip_local_port_range = 32768 61000 当创build一个新的连接时，它会使用其中一个TIME_WAIT端口吗？或尝试绑定一个不同的，开放的端口？如果我把这个variables设置到端口1024-65535，如果我有一些应用程序在该范围内的端口上运行，会发生什么？这不是一个如何最小化TIME_WAIT连接状态的问题。当前的内核修改： # sysctl net.ipv4.tcp_tw_recycle net.ipv4.tcp_tw_recycle = 0 # sysctl net.ipv4.tcp_tw_reuse net.ipv4.tcp_tw_reuse = 1 # sysctl net.ipv4.tcp_fin_timeout net.ipv4.tcp_fin_timeout = 30 # sysctl net.ipv4.tcp_timestamps net.ipv4.tcp_timestamps = 1 # sysctl net.ipv4.tcp_sack net.ipv4.tcp_sack = 1

如何从系统日志中find系统挂起的原因？

我正在Amazon EC2实例中运行Ubuntu 10.04 LTS。系统突然变得没有反应。当我检查日志文件时，我在/ var / log / syslog中发现了以下错误 2月22日04:10:01 ip-10-0-1-12 CRON [16153] :(根）CMD（/ usr / sbin / cm-sysmon）^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ ^ @ […]

内核更新后，CentOS OpenVZ无法启动

升级到最新的OpenVZ内核后，CentOS服务器将无法启动。当我尝试去引导最新的内核服务器卡住在这一点:(注意，图像是从虚拟kvm采取）然后，我尝试启动服务器上的一些旧的内核，比我得到这个错误消息： kernel panic – not syncing – attempted to kill init 更好的显示在这张图片上：这里有一些有用的信息 fdisk -l WARNING: GPT (GUID Partition Table) detected on '/dev/sda'! The util fdisk doesn't support GPT. Use GNU Parted. Disk /dev/sda: 2995.7 GB, 2995739688960 bytes 255 heads, 63 sectors/track, 364211 cylinders Units = cylinders of 16065 * 512 = 8225280 […]

查找ulimit配额的数量

所以，我们的软件可能会有某种程度的漏洞。我们正在使用Mono，并在几个星期/几个月的时间内产生许多进程。最终，我们不能在我们的客户机器上产卵。通常需要20个小时才能停止。 closures并重新打开我们的应用程序修复它。当产卵失败时，整个系统运行的总进程less于500个，并且在整个系统上less于1000个文件句柄。 ulimits文件被设置为高ISH水平，我相信过程限制是8K左右。我们正在运行CentOS 6.2。如果我们正在泄漏这些PID或句柄，标准的ps和lsof命令只是不显示它们（都不是/ proc），我需要一种方法来挖掘内核或其他东西，看看目前的值是什么限制testing。一旦我们确认了这个问题，我就可以尝试破译造成这件事情的有趣任务了…但是那又来了一天。据我们所知，这个应用程序在许多许多其他的Linux机器上工作，没有任何问题（其他客户没有向我们报告这个问题）。任何想法，我怎么能findulimit设置的指标的价值？我拼命地希望自己不必编写C程序，但是如果有必要的话，我还没有做过。

Ubuntu – 从3.0内核开始随机重启

我有一个现在升级到12.04 LTS服务器的Ubuntu服务器。自从我从10.10升级到11.04之后，当内核从2.6.38升级到3.0时，我的机器会不停地随机重启大约2-3分钟。无论是闲置还是我做了什么，都会随机重启。现在如果我在11.04或11.10或事件12.04中select了2.6.38的旧内核，它将是坚如磐石，没有任何抱怨。但是，如果我执行任何需要重新启动的更新，我总是会testing新的内核版本是否能解决导致随机重新启动的问题。现在升级到12.04和3.2内核，我真的希望所有的东西都能解决，但是令我失望的是，它仍然在进行随机重启。不过，我认为12.04有一个新的function，提供了一个线索的根本原因。我有一个屏幕报告错误，因为它报告“colord”守护进程导致与SIGSEGV消息崩溃。所以，如果有人有同样的问题，这是一个长远的目标，因为我过去一年search这个东西没有用。我不想重build盒子，因为我所要做的就是回到2.6内核，一切正常。欣赏任何input！

Solaris：什么是内核陷阱？

我试图了解是否在Solaris 10上报告的高陷阱数内核：1659 ctxsw， 1069 trap ，4433 intr，3837 syscall，5 fork内存：8192M物理内存，299M空闲内存，总共4103M交换，3236M免费交换是否有问题。谷歌陷阱谷歌search主要返回内核架构上的大文件; 悬崖笔记将不胜感激。谢谢 PS。没关系交换

Intereting Posts

Postgresangular色最佳实践实施使用上下文版本控制在Tomcat 7上部署Java应用程序 CentOS / RHEL默认网关的正确位置是什么？无线networking正在放慢整个networking 如何将标签应用到受pipe实例组的实例？确定一个GETpath 多站点托pipe：虚拟主机工作不正常这些IPMI系统事件日志是什么意思？当我启动apache2时，与python版本相关的错误添加到错误日志中是否有可能在1and1托pipe机器上运行一个asp.net mvc（.net 3.5）网站？ ESXi服务器场景的vCPU和RAM 在Centos6.5上的Nginx + PHP-FPM给了我502错误的网关（fpm错误：无法读取孩子说：错误的文件描述符） rsyslog udp转发截断2048个字符在Linux VPS上混淆RAM使用量度量 “代理发送”权限和“您没有权限发送给此收件人”错误

Articles of 内核