是否有可能在Linux中看到有多less来自用户空间的读取和写入请求最终导致caching命中和未命中块设备?
您可以开发自己的SystemTap脚本。 您需要考虑以下两个子系统:
SystemTap开发需要一些时间来学习。 如果你是一个中等程度的开发人员,对Linux有很好的了解,那么你应该在3-4天内完成。 是的,学习需要时间,但结果会让你非常满意–SystemTap让你有机会(安全地)将探测器放在Linux内核的任何地方。
请注意,您的内核必须支持加载和卸载内核模块。 现在大多数股票内核都支持这一点。 您还需要安装内核的debugging符号。 对于我的Ubuntu系统,这就像下载一个几百MB的.deb文件一样简单,Ubuntu内核开发团队为我编译。 例如,在SystemtapOnUbuntu Wiki页面中对此进行了解释。
PS只有在没有其他解决scheme的情况下,才能采用SystemTap方法,因为这是一个全新的框架,您必须学习,这样会花费时间/金钱,有时会感到沮丧。
我继续为此写了一个stap脚本。 在systemtap wiki上有一个,但它似乎不正确。 在基本testing中,这看起来相当准确,但是YMMV。
#! /usr/bin/env stap global total_bytes, disk_bytes, counter probe vfs.read.return { if (bytes_read>0) { if (devname=="N/A") { } else { total_bytes += bytes_read } } } probe ioblock.request { if (rw == 0 && size > 0) { if (devname=="N/A") { } else { disk_bytes += size } } } # print VFS hits and misses every 5 second, plus the hit rate in % probe timer.s(5) { if (counter%15 == 0) { printf ("\n%18s %18s %10s %10s\n", "Cache Reads (KB)", "Disk Reads (KB)", "Miss Rate", "Hit Rate") } cache_bytes = total_bytes - disk_bytes if (cache_bytes < 0) cache_bytes = 0 counter++ hitrate = 10000 * cache_bytes / (cache_bytes+disk_bytes) missrate = 10000 * disk_bytes / (cache_bytes+disk_bytes) printf ("%18d %18d %6d.%02d%% %6d.%02d%%\n", cache_bytes/1024, disk_bytes/1024, missrate/100, missrate%100, hitrate/100, hitrate%100) total_bytes = 0 disk_bytes = 0 }
/ proc / slabinfo是一个很好的开始,但并不能给你提供很多你想要的信息(不要被多核和统计启用的系统中的命中率错过百分比所迷惑;这些是别的)。 据我所知,没有办法将特定的信息从内核中提取出来,尽pipe编写一些代码不是非常困难。
编辑: http : //www.kernel.org/doc/man-pages/online/pages/man5/slabinfo.5.html
现在有来自perf-tools包的cachestat 工具 。
作者还列出了一些(可能更为粗略的)人们使用的替代scheme:
A)通过使用iostat(1)来监视磁盘读取,并假设这些是caching未命中,而不是例如O_DIRECT,研究页面caching未命中率。 缺失率通常比比率更重要,因为失误与应用程序痛苦成正比。 也可以使用free(1)查看caching大小。
B)删除页面caching(echo 1> / proc / sys / vm / drop_caches),并测量性能会变差多less! 我喜欢使用一个负面的实验,但这当然是一个痛苦的方式来阐明caching使用情况。
C)使用sar(1)并研究轻微和重大缺陷。 我不认为这有效(例如,常规的I / O)。
D)使用cache-hit-rate.stp SystemTap脚本,这是InternetsearchLinux页面caching命中率中的第二个。 它在VFS接口中将堆栈中的高速caching访问设置为高,以便可以看到对任何文件系统或存储设备的读取。 caching未命中通过磁盘I / O进行测量。 这也错过了一些工作量types(有些在该页面的“课程”中提到),并且调用比率“率”。
如果您对特定进程的IO命中/未命中比率感兴趣,一个简单但非常有效的方法是读取/proc/<pid>/io
文件。
在这里你会发现4个关键值:
rchar
:从应用程序的angular度来看读取字节的总数(即:从物理存储而不是从caching中读取的读取之间没有区别) wchar
:如上所述,但写入字节 read_bytes
: 真正从存储子系统读取的字节 write_bytes
: 真正写入存储子系统的字节 说一个过程有以下值:
rchar: 1000000 read_bytes: 200000
读caching失败率(以字节为单位)为100*200000/1000000 = 20%
,命中率为100-20 = 80%
但是有一个问题: rchar
值包括tty IO,所以对于从pipe道读取/写入很多的进程,上面的计算会产生偏斜,报告的命中率比有效的高。