什么是收集文件系统使用统计信息的好工具?

我们有许多用于计算集群的文件系统,许多用户存储大量真正大的文件。 我们希望监视文件系统并帮助优化文件系统的使用情况,并计划扩展。

为此,我们需要一些方法来监视这些文件系统是如何使用的。 基本上我想知道关于这些文件的各种统计信息:

  • 年龄
  • 访问频率
  • 上次访问时间
  • types
  • 尺寸

理想情况下,这些信息将以任何目录的聚合forms提供,以便我们可以根据项目或用户对其进行监控。

我没有用Python写自己的东西,我还没有find任何能够履行这些职责的工具。 任何build议?

你可能想要用inotify来logging文件系统事件。 也许类似于logsend 。 另请参阅inotify-tools 。

哇。 Novell在其NSS卷上的Open Enterprise Server上有很多类似的function,可以提供大部分function。 没有频率的访问,这是代表上次访问date,但绝对是其余的。 这是一个Java进程,它爬取卷树来构build他们所谓的“库存”。 我很确定它不是开源的,但是这个报告是相当不错的。

我会去python的方式。 os.walk()很容易使用,并且每个文件所需的所有信息都在stat()