我们正在运行PGSQL 9.2 ,以下是硬件规格 OS: CentOS7 64bit CPU: 24 Memory: 32GB Disk: SSD 我想计算shmmax / shmall值,那么最好的方法是什么? 我谷歌和人说50%的总内存。 但在我的箱子,我只有PGSQL运行,那么为什么不是总内存的80%? 我可以configurationkernel.shmmax 28GB吗? 并保持4G的Linux操作系统。 你有什么build议?
在ifconfig输出我看到Interrupt 16但是当我检查/proc/irq/我没有看到16那里。 以下数字我在这里看到。 我的司机是broadcom tg3 [root@centos7 ~]# ls /proc/irq/*/eno1* /proc/irq/156/eno1-tx-0: /proc/irq/157/eno1-rx-1: /proc/irq/158/eno1-rx-2: /proc/irq/159/eno1-rx-3: /proc/irq/160/eno1-rx-4: 我有非常差的networking性能,所以检查NAPI的支持,发现奇怪的中断缺less这个:(
我们有6台Supermicro服务器都是相同的(或非常相似的规格),在过去的两周内,其中一台NVM随机丢弃了一块磁盘,原因是: [ 66.856719] nvme 0000:03:00.0: I/O 0 QID 0 timeout, disable controller [ 66.957911] nvme 0000:03:00.0: Identify Controller failed (-4) [ 66.957961] nvme 0000:03:00.0: Removing after probe failure status: -5 我们试过了: 交换磁盘 交换NVMe电缆 交换NVMe控制器(主板) 交换背板 考虑到存储子系统的最近更改,从内核4.5.0降级到4.4.2 升级磁盘和主板固件 交换主板 所以它基本上是一个全新的服务器,除了我们没有重新安装 – 为什么? 因为我想了解这个问题,如果重新安装修复它,我们永远不会知道为什么会发生在这台机器上,而不是我们的其他5。 驱动器运行时不报告SMART或nvme-cli错误。 如果驱动器交换到另一个托架,它工作正常,无论驱动器被更换到该托架,然后最终超时/失败。 CentOS 7(最新的补丁安装) 内核4.5.0 2个Intel DC3600 NVMe(2.5“FF) 英特尔公司的C610 / X99系列芯片组 完整的lspci -tvv输出: […]
我知道一个Windows的系统会因为一些常见原因而停止运行并出现“蓝屏”,其中一些可能是: 在内核模式空间中运行的设备驱动程序或操作系统function会遇到未处理的exception(内存访问问题等) 设备驱动程序或操作系统function会显式崩溃系统,因为它检测到损坏或损坏风险 硬件故障 我感兴趣的是,当检查崩溃转储(比如说WinDBG)时,转储将始终指示导致崩溃的线程,从而允许检查该线程的堆栈,提供导致错误检查和崩溃。 走这个堆栈会给出如何防止未来问题的线索(例如,特定的驱动程序需要更新等)。 知道这一点,我问自己下面的问题,这揭示了我的知识上的差距: 在多核/处理器系统上,多个线程将同时执行 那么肯定有两个线程同时发生错误检查的可能性? 在这种情况下会发生什么? 我对于操作系统在并发执行和访问内存和硬件(IRQL和延迟过程调用(DPC)等)方面如何处理多核/处理器系统有一个基本的误解? 谢谢
有没有办法告诉内核保留一定数量的可用内存,而不是将其用于caching? 我听到你在想:“为什么你会想要这个?!当有人想要的时候,caching的RAM是可用的RAM!” 这是一个特例。 看起来,一个ip位置服务的nginx插件检查重装前的免费ram的数量,它拒绝重新启动/重新加载,如果没有足够的严格可用的RAM来做到这一点。 在这种情况下,我有一些服务器…所有的内存caching和一个拒绝重启自己的nginx。 所以我必须手动(或“cronly”)做一个drop_caches有足够严格的可用RAM的nginx重新启动。 我想有一个方法来指定一个最大数量的cachingram或一个最低严格的免费RAM,以保持可用摆脱hacky drop_caches方法
我最近设置了使用英特尔硬件TCO的watchdog ,它会自动重启系统崩溃(使用Ubuntu LTS)。 在watchdog.conf您可以在重新启动之前configuration一个超时。 默认为60秒。 由于我的设备正在播放商店中的audio,当发生崩溃时(声音卡在一个循环中),这可能会有问题。 我想知道我可以走多低? 我使用了默认的in_memory=true和realtime=true 。 谢谢!
我有一个IBM x3850平方米的服务器,ibm serveraid mr10k raid卡,这是一个lsi megaraid卡。 我的问题是,如果我尝试运行linux,使用4.4内核,我需要使用iommu = soft kernel arg来使其工作。 没有这个选项,我得到这个错误: 卡尔加里:CalIOC2 PHB 0x3上的DMA错误 我也尝试pci = nomsi,但有了这个选项,我得到另一个错误: NMI看门狗:Bug:软locking – CPU#1卡住了22秒! [udevd:1381] 我可以用这个arg来解决这个错误:acpi = off,但是这个系统不会看到RAID卡。 iommu = soft的问题是巨大的负载(大约70或更多)。 使用内核3.10,卡工作没有问题。 我在服务器上使用proxmox 4.4,3.10内核将不能使用这个版本。 有两种方法,降级proxmox或megaraid_sas驱动程序解决问题。
我有一个在OVH上运行Debian 8的VPS。 最近我无法连接到SSH,因为我收到消息:“访问被拒绝”。 所以我决定重置根密码。 我遵循OVH指示为了重置根密码: 我连接到网站pipe理员,我点击了“重置密码”button。 之后,服务器在Rescue Mode(救援模式)下重新启动,并在我的电子邮件中收到root用户的新密码。 我input以下命令以重置密码: fdisk -l mount / dev / vdb1 / mnt chroot / mnt passwd(我input了新的密码两次) 你可以在这里find这个教程: https : //www.ovh.com/us/g2366.change_the_root_password_on_a_vps_linux 我从Webpipe理器重新启动服务器,以重新启动并退出Rescue模式。 几分钟后,我无法通过SSH / FTP / SFTP进行连接。 我联系了OVH技术支持人员,他们告诉我从Webpipe理员(SSH客户端)访问“KVM”button。 我点击那个button,我看到以下错误(我不能滚动以查看entre错误消息): KVM控制台被封锁了这个错误。 我什么都做不了 所以我发送了一个错误的截图给OVH支持。 他们的“专家”build议我备份数据并重新从头开始重新安装VPS。 这是不可接受的。 我有一个nginx服务器,PHP,MySql,大量的cron作业和SSL安装。 你有什么想法,我怎样才能解决这个问题,而不会丢失任何数据? 我可以卸载并创build一个新的挂载? 我应该运行apt-get升级/更新还是一些与内核相关的命令? 请帮忙,预计谢谢。
所以说我有一个内核版本。 就像其中之一一样: 3.10.0-229.el7.x86_64 2.6.32-220.el6.x86_64 3.10.0-514.26.2.el7.x86_64 3.10.35-43.137.amzn1.x86_64 2.6.32-358.14.1.el6.x86_64 有没有办法以编程方式获得内核版本易受攻击的CVE列表? 我知道,如果我知道一个CVE,我可以很容易地看到哪个内核版本容易受到攻击,但是我正在寻找另一种方式。
我有一个2负载均衡器后面的mod_php web服务器,这些操作系统是CentOS 6.x. 他们应该是相同的。 他们应该使用循环法收到相同的请求。 其中一个比另一个performance糟糕。 我认为这是因为某些原因收到更多的请求: 事实并非如此。 这些请求大概是同一个URL,并且几乎同时有相同数量的请求。 性能仍然糟糕。 那么我决定帮助服务器,而我find了解决scheme。 所以我重新configuration负载平衡器。 负载平衡器的configuration更改是将请求发送到服务器,并打开较less的连接。 在此之后,服务器开始比第二台服务器接收更less的请求,性能仍然比其他服务器差。 只是为了强调差异,此时请求分配约35至65%。 一般来说,关于相同的URL请求比率。 现在,我认为我们有两个服务器之间的其他用户软件水平差异。 事实并非如此。 我们自动pipe理configuration和代码。 PHP有相同的模块加载,Apache也。 代码没有区别。 硬件是一样的。 作为额外的信息,我们不会有粘滞的会议。 请求被随机定向到两个服务器。 我们也testing了这一点。 configuration更改后的差异是具有该问题的服务器接收的请求less得多。 服务器在处理请求或连接到其他组件(如数据库)时没有任何有意义的时间差异。 鉴于此背景检查当前的CPU图像。 带有问题的服务器: web1 image CPU性能通知RED表示系统CPU时间不是用户,apache是用户空间。 还请注意,这些图像是从更改后得到更less的请求到web1(有问题)。 在我们有严重的CPU和负载平均问题之前,那么这里是另一台服务器。 Web2镜像CPU性能 。 没有检测到IO,RAM或其他硬件问题。 这让我怀疑内核问题。 top似乎也是这样说的。 顶级Web1与Web2图像性能 然后我注意到内核因为某种原因加载了不同的模块。 因为我找不到其他的区别。 由于服务器应该是相同的,我实际上已经足够了。 BOSS希望能够在删除内核模块之前将其链接到实际问题。 我尝试了一些东西,包括perf,但没有pipe理。 Perf( perf record -F 99 -a -g — sleep 30 […]