衡量对文件的访问 – apache

所以，我运行一个网站，其中包括一些文件（通常是PDF）。

所有这些都存储在服务器上的特定目录下： /var/www/vhosts/mysite.com/httpdocs/site/pdf_files

由于我的VPS上的存储问题，我正在考虑获取一些S3或其他云存储，并使用S3QL / S3FS将其作为驱动器挂载。然后，我将能够将pdf_files文件夹符号链接到云文件夹，并使用该文件夹来提供这些文件，而无需对Web应用程序进行任何更改（这是一个好的计划？）

现在，在这之前，为了估计成本，我需要测量人们进行文件访问的次数，例如每月下载这些pdf文件的次数。基本上这些pdf文件通过networking服务器访问多less次。

我想在Apache的水平上做。这可以做的最好的方法是什么？

例如：测量特定文件夹中的文件使用的带宽也不错，但估计我将要做的亚马逊的GET请求更重要。

假设你有你的访问日志可用，快速和容易的事情是做：

grep pdf_filename access_log | grep 200

基本上，你parsingPDF文件的日志文件，然后得到HTTP 200代码消息，这意味着用户已成功下载文件。以下是一个典型的具有成功请求的日志文件行：

127.0.0.1 – 坦率[10 / Oct / 2000：13：55：36 -0700]“GET /apache_pb.gif HTTP / 1.0”200 2326“ http://www.example.com/start.html ”“Mozilla / 4.08 [en]（Win98; I; Nav）

（请密切关注200代码和URL之间的数字值 – 这是下载的文件的大小）。

或者，您可以下载Webalizer等日志分析器：

Webalizer的

并将其configuration为跟踪有多less用户下载PDF以及传输速率。