所以,我运行一个网站,其中包括一些文件(通常是PDF)。
所有这些都存储在服务器上的特定目录下: /var/www/vhosts/mysite.com/httpdocs/site/pdf_files
由于我的VPS上的存储问题,我正在考虑获取一些S3或其他云存储,并使用S3QL / S3FS将其作为驱动器挂载。 然后,我将能够将pdf_files文件夹符号链接到云文件夹,并使用该文件夹来提供这些文件,而无需对Web应用程序进行任何更改(这是一个好的计划?)
现在,在这之前,为了估计成本,我需要测量人们进行文件访问的次数,例如每月下载这些pdf文件的次数。 基本上这些pdf文件通过networking服务器访问多less次。
我想在Apache的水平上做。 这可以做的最好的方法是什么?
例如:测量特定文件夹中的文件使用的带宽也不错,但估计我将要做的亚马逊的GET请求更重要。
假设你有你的访问日志可用,快速和容易的事情是做:
grep pdf_filename access_log | grep 200
基本上,你parsingPDF文件的日志文件,然后得到HTTP 200代码消息,这意味着用户已成功下载文件。 以下是一个典型的具有成功请求的日志文件行:
127.0.0.1 – 坦率[10 / Oct / 2000:13:55:36 -0700]“GET /apache_pb.gif HTTP / 1.0”200 2326“ http://www.example.com/start.html ”“Mozilla / 4.08 [en](Win98; I; Nav)
(请密切关注200代码和URL之间的数字值 – 这是下载的文件的大小)。
或者,您可以下载Webalizer等日志分析器:
Webalizer的
并将其configuration为跟踪有多less用户下载PDF以及传输速率。