内核服务器 Gind.cn

Postgresql计算内核共享内存？

我们正在运行PGSQL 9.2 ，以下是硬件规格 OS: CentOS7 64bit CPU: 24 Memory: 32GB Disk: SSD 我想计算shmmax / shmall值，那么最好的方法是什么？我谷歌和人说50％的总内存。但在我的箱子，我只有PGSQL运行，那么为什么不是总内存的80％？我可以configurationkernel.shmmax 28GB吗？并保持4G的Linux操作系统。你有什么build议？

奇怪的networking中断问题

在ifconfig输出我看到Interrupt 16但是当我检查/proc/irq/我没有看到16那里。以下数字我在这里看到。我的司机是broadcom tg3 [root@centos7 ~]# ls /proc/irq/*/eno1* /proc/irq/156/eno1-tx-0: /proc/irq/157/eno1-rx-1: /proc/irq/158/eno1-rx-2: /proc/irq/159/eno1-rx-3: /proc/irq/160/eno1-rx-4: 我有非常差的networking性能，所以检查NAPI的支持，发现奇怪的中断缺less这个:(

nvme设备丢失 – I / O 0 QID 0超时，控制器被禁用

我们有6台Supermicro服务器都是相同的（或非常相似的规格），在过去的两周内，其中一台NVM随机丢弃了一块磁盘，原因是： [ 66.856719] nvme 0000:03:00.0: I/O 0 QID 0 timeout, disable controller [ 66.957911] nvme 0000:03:00.0: Identify Controller failed (-4) [ 66.957961] nvme 0000:03:00.0: Removing after probe failure status: -5 我们试过了：交换磁盘交换NVMe电缆交换NVMe控制器（主板）交换背板考虑到存储子系统的最近更改，从内核4.5.0降级到4.4.2 升级磁盘和主板固件交换主板所以它基本上是一个全新的服务器，除了我们没有重新安装 – 为什么？因为我想了解这个问题，如果重新安装修复它，我们永远不会知道为什么会发生在这台机器上，而不是我们的其他5。驱动器运行时不报告SMART或nvme-cli错误。如果驱动器交换到另一个托架，它工作正常，无论驱动器被更换到该托架，然后最终超时/失败。 CentOS 7（最新的补丁安装）内核4.5.0 2个Intel DC3600 NVMe（2.5“FF）英特尔公司的C610 / X99系列芯片组完整的lspci -tvv输出： […]

多核系统上的BSOD错误检查 – 什么线程导致崩溃？

我知道一个Windows的系统会因为一些常见原因而停止运行并出现“蓝屏”，其中一些可能是：在内核模式空间中运行的设备驱动程序或操作系统function会遇到未处理的exception（内存访问问题等）设备驱动程序或操作系统function会显式崩溃系统，因为它检测到损坏或损坏风险硬件故障我感兴趣的是，当检查崩溃转储（比如说WinDBG）时，转储将始终指示导致崩溃的线程，从而允许检查该线程的堆栈，提供导致错误检查和崩溃。走这个堆栈会给出如何防止未来问题的线索（例如，特定的驱动程序需要更新等）。知道这一点，我问自己下面的问题，这揭示了我的知识上的差距：在多核/处理器系统上，多个线程将同时执行那么肯定有两个线程同时发生错误检查的可能性？在这种情况下会发生什么？我对于操作系统在并发执行和访问内存和硬件（IRQL和延迟过程调用（DPC）等）方面如何处理多核/处理器系统有一个基本的误解？谢谢

我可以强制Linux内核更积极地保留免费的RAM

有没有办法告诉内核保留一定数量的可用内存，而不是将其用于caching？我听到你在想：“为什么你会想要这个？！当有人想要的时候，caching的RAM是可用的RAM！” 这是一个特例。看起来，一个ip位置服务的nginx插件检查重装前的免费ram的数量，它拒绝重新启动/重新加载，如果没有足够的严格可用的RAM来做到这一点。在这种情况下，我有一些服务器…所有的内存caching和一个拒绝重启自己的nginx。所以我必须手动（或“cronly”）做一个drop_caches有足够严格的可用RAM的nginx重新启动。我想有一个方法来指定一个最大数量的cachingram或一个最低严格的免费RAM，以保持可用摆脱hacky drop_caches方法

什么最小的硬件看门狗设备超时被认为是安全的？

我最近设置了使用英特尔硬件TCO的watchdog ，它会自动重启系统崩溃（使用Ubuntu LTS）。在watchdog.conf您可以在重新启动之前configuration一个超时。默认为60秒。由于我的设备正在播放商店中的audio，当发生崩溃时（声音卡在一个循环中），这可能会有问题。我想知道我可以走多低？我使用了默认的in_memory=true和realtime=true 。谢谢！

IBM x3850 m2 raid卡和linux 4.4内核

我有一个IBM x3850平方米的服务器，ibm serveraid mr10k raid卡，这是一个lsi megaraid卡。我的问题是，如果我尝试运行linux，使用4.4内核，我需要使用iommu = soft kernel arg来使其工作。没有这个选项，我得到这个错误：卡尔加里：CalIOC2 PHB 0x3上的DMA错误我也尝试pci = nomsi，但有了这个选项，我得到另一个错误： NMI看门狗：Bug：软locking – CPU＃1卡住了22秒！ [udevd：1381] 我可以用这个arg来解决这个错误：acpi = off，但是这个系统不会看到RAID卡。 iommu = soft的问题是巨大的负载（大约70或更多）。使用内核3.10，卡工作没有问题。我在服务器上使用proxmox 4.4，3.10内核将不能使用这个版本。有两种方法，降级proxmox或megaraid_sas驱动程序解决问题。

内核恐慌 – 不同步试图在挂载后终止init

我有一个在OVH上运行Debian 8的VPS。最近我无法连接到SSH，因为我收到消息：“访问被拒绝”。所以我决定重置根密码。我遵循OVH指示为了重置根密码：我连接到网站pipe理员，我点击了“重置密码”button。之后，服务器在Rescue Mode（救援模式）下重新启动，并在我的电子邮件中收到root用户的新密码。我input以下命令以重置密码： fdisk -l mount / dev / vdb1 / mnt chroot / mnt passwd（我input了新的密码两次）你可以在这里find这个教程： https ： //www.ovh.com/us/g2366.change_the_root_password_on_a_vps_linux 我从Webpipe理器重新启动服务器，以重新启动并退出Rescue模式。几分钟后，我无法通过SSH / FTP / SFTP进行连接。我联系了OVH技术支持人员，他们告诉我从Webpipe理员（SSH客户端）访问“KVM”button。我点击那个button，我看到以下错误（我不能滚动以查看entre错误消息）： KVM控制台被封锁了这个错误。我什么都做不了所以我发送了一个错误的截图给OVH支持。他们的“专家”build议我备份数据并重新从头开始重新安装VPS。这是不可接受的。我有一个nginx服务器，PHP，MySql，大量的cron作业和SSL安装。你有什么想法，我怎样才能解决这个问题，而不会丢失任何数据？我可以卸载并创build一个新的挂载？我应该运行apt-get升级/更新还是一些与内核相关的命令？请帮忙，预计谢谢。

如果我有一个内核版本，我可以得到它易受攻击的CVE列表吗？

所以说我有一个内核版本。就像其中之一一样： 3.10.0-229.el7.x86_64 2.6.32-220.el6.x86_64 3.10.0-514.26.2.el7.x86_64 3.10.35-43.137.amzn1.x86_64 2.6.32-358.14.1.el6.x86_64 有没有办法以编程方式获得内核版本易受攻击的CVE列表？我知道，如果我知道一个CVE，我可以很容易地看到哪个内核版本容易受到攻击，但是我正在寻找另一种方式。

Linux内核和Apache 2.2性能问题在两个不同的Web服务器上

我有一个2负载均衡器后面的mod_php web服务器，这些操作系统是CentOS 6.x. 他们应该是相同的。他们应该使用循环法收到相同的请求。其中一个比另一个performance糟糕。我认为这是因为某些原因收到更多的请求：事实并非如此。这些请求大概是同一个URL，并且几乎同时有相同数量的请求。性能仍然糟糕。那么我决定帮助服务器，而我find了解决scheme。所以我重新configuration负载平衡器。负载平衡器的configuration更改是将请求发送到服务器，并打开较less的连接。在此之后，服务器开始比第二台服务器接收更less的请求，性能仍然比其他服务器差。只是为了强调差异，此时请求分配约35至65％。一般来说，关于相同的URL请求比率。现在，我认为我们有两个服务器之间的其他用户软件水平差异。事实并非如此。我们自动pipe理configuration和代码。 PHP有相同的模块加载，Apache也。代码没有区别。硬件是一样的。作为额外的信息，我们不会有粘滞的会议。请求被随机定向到两个服务器。我们也testing了这一点。 configuration更改后的差异是具有该问题的服务器接收的请求less得多。服务器在处理请求或连接到其他组件（如数据库）时没有任何有意义的时间差异。鉴于此背景检查当前的CPU图像。带有问题的服务器： web1 image CPU性能通知RED表示系统CPU时间不是用户，apache是用户空间。还请注意，这些图像是从更改后得到更less的请求到web1（有问题）。在我们有严重的CPU和负载平均问题之前，那么这里是另一台服务器。 Web2镜像CPU性能。没有检测到IO，RAM或其他硬件问题。这让我怀疑内核问题。 top似乎也是这样说的。顶级Web1与Web2图像性能然后我注意到内核因为某种原因加载了不同的模块。因为我找不到其他的区别。由于服务器应该是相同的，我实际上已经足够了。 BOSS希望能够在删除内核模块之前将其链接到实际问题。我尝试了一些东西，包括perf，但没有pipe理。 Perf（ perf record -F 99 -a -g — sleep 30 […]

Intereting Posts

LAMP堆栈，只读/写访问特定的目录我如何使用BGP和Quagga执行优惠路线？ CRON没有任何事情发生使用替代CA（如Microsoft证书服务）和Puppet 在线/离线安装/卸载磁盘有什么区别？安全的Linux服务器由dir权限通过网页进行活动目录pipe理 Ubuntu升级11.10到12.04 – MySQL迁移索引目录无法在PDF文本上search 仅通过HTTPS进行kickstart 用postfixdebuggingspamassassin 我可以禁用Pam Loginuid吗？我可以找出用于configuration内核的选项吗？路由器看到IP别名？无法连接到Gmail的SMTP服务器 DMARCalignment：强制消息传递SPOT和DKIM

Articles of 内核