我们有许多用于计算集群的文件系统,许多用户存储大量真正大的文件。 我们希望监视文件系统并帮助优化文件系统的使用情况,并计划扩展。
为此,我们需要一些方法来监视这些文件系统是如何使用的。 基本上我想知道关于这些文件的各种统计信息:
理想情况下,这些信息将以任何目录的聚合forms提供,以便我们可以根据项目或用户对其进行监控。
我没有用Python写自己的东西,我还没有find任何能够履行这些职责的工具。 任何build议?
你可能想要用inotify来logging文件系统事件。 也许类似于logsend 。 另请参阅inotify-tools 。
哇。 Novell在其NSS卷上的Open Enterprise Server上有很多类似的function,可以提供大部分function。 没有频率的访问,这是代表上次访问date,但绝对是其余的。 这是一个Java进程,它爬取卷树来构build他们所谓的“库存”。 我很确定它不是开源的,但是这个报告是相当不错的。
我会去python的方式。 os.walk()很容易使用,并且每个文件所需的所有信息都在stat() 。