在select开源网站分析工具时需要一些build议,包括页面标记和日志文件分析types。 我知道其中的一些:piwik,开放式网站分析,awstats等…其中最好的(页面标记types和日志文件分析types)是什么?
在日志文件分析器域中,这些是最广泛使用的:
模拟和Webalizer是用C编写的,速度更快(每秒10000-20000行)。
正如@MadHatter Analog早些时候提到的,Analog是由前剑桥统计师开发的,这使得Analog成为一个非常精确和技术性的工具,但从2005年开始,它不再被开发出来。
Webalizer不再开发,但使用Analog更容易。
AWStat和W3Perl是用Perl编写的,它们是最活跃的项目,但是比Analog和Webalizer(每秒3000/4500行)慢得多。 它们的数据生成方式和数据呈现方式各不相同。
AWStat以非常有吸引力的方式显示统计数据,但是W3Perl产生的统计量更less。
我build议你这些链接的进一步信息:
http://www.aardal.com/stats/docs/uk/speed.html
http://www.w3perl.com/
http://awstats.sourceforge.net/
我的build议是:
关于页面标记胜利者肯定是谷歌分析,收集和生成的数据比其他解决scheme更好,但有一天可能会发生,谷歌会问钱… …
W3Counter和Xiti是需要你的免费版本,在你想要监控的每个网页上安装一个图像。 两者都适用于小型网站。
开放式Web分析和Pikwik是伟大的开源解决scheme。 两者都相当成熟和稳定,但它们需要MySQL数据库和PHP支持。
如果您不需要“自制”解决scheme,我肯定会select使用Google Analytics,而在开源项目之间,我会selectOpen Web Analytics,因为它比Piwik更成熟。
我对piwik非常满意。 我只是错过了调整依赖于网站的小部件的可能性。 我用它来检查我的drupal网站,也有一个drupal的模块。
为了我的钱,最好的日志分析工具是模拟的 。 这是一个前剑桥统计学家编写的一个非常有用的页面,它告诉你 – 和你的pipe理层 – 从你的web日志中可以或不能正确地知道什么,它是令人吃惊的快速模数DNS查找,离奇的商业索赔尽pipe如此。
虽然我不能评论页面标签, 抱歉。
这是实验性的软件,但是相当令人印象深刻:
蜂鸟让你看到游客如何与您的网站实时交互。 “实时”并不意味着每隔5分钟刷新一次 – WebSockets使蜂鸟每秒更新20次。 蜂鸟build立在Node.js之上,一个新的JavaScriptnetworking工具包,可以处理大量的stream量和许多并发用户。
我会说(虽然我有点偏向共同创始人;-)), SnowPlow是目前最强大的基于开源标签的网站分析工具。
SnowPlow采用松散耦合的分布式架构,使用Hadoop和Hive,因此它可以扩展到数百万乃至数十亿个事件 – 这是MySQL或其他基于RDBMS的解决scheme无法做到的。
SnowPlow的另一个重大创新是您的事件数据存储在一个干净的,不可变的,非规范化的primefaces“平面文件”结构中 – 换句话说就是一个分析数据仓库。 这使得使用Hive进行大量非常复杂的分析,以及与第三方数据(例如CRM或销售数据)的直接连接成为可能。 同样,这比其他解决scheme更强大,这些解决scheme倾向于将primefaces数据折叠成聚合体,截断旧数据或使用头部划痕的标准化结构,这些结构很难直接查询或join其他来源。
您可以在这里阅读更多关于SnowPlow的技术架构 。
Boomerang是用于客户端性能分析的最佳工具 – 但它只是js代理 – 我不知道任何现成的报告工具,对于已经提到的networking工具Piwik和AwStats, 它是有用的。 模拟是一个非常类似于AwStats的工具 – 不易configuration,但处理速度更快。
如果你正在寻找自己的解决scheme,有免费的IP地址数据可用
我知道使用Webalizer进行网站日志分析的人员。 只是再提一个选项。
还有关于可能性的讨论。
经过对开放源代码networking分析软件包的一些研究,我认为明确的获奖者是http://www.openwebanalytics.com和http://piwik.org/
原因是易于使用,安装实时function。
我想提到的一个令人印象深刻的function是由openwebanalytics生成的热图。