最强大的开源网站分析工具?

在select开源网站分析工具时需要一些build议,包括页面标记和日志文件分析types。 我知道其中的一些:piwik,开放式网站分析,awstats等…其中最好的(页面标记types和日志文件分析types)是什么?

在日志文件分析器域中,这些是最广泛使用的:

  • AWStats软件
  • Webalizer的
  • 类似物
  • W3Perl

模拟和Webalizer是用C编写的,速度更快(每秒10000-20000行)。

正如@MadHatter Analog早些时候提到的,Analog是由前剑桥统计师开发的,这使得Analog成为一个非常精确和技术性的工具,但从2005年开始,它不再被开发出来。

Webalizer不再开发,但使用Analog更容易。

AWStat和W3Perl是用Perl编写的,它们是最活跃的项目,但是比Analog和Webalizer(每秒3000/4500行)慢得多。 它们的数据生成方式和数据呈现方式各不相同。

AWStat以非常有吸引力的方式显示统计数据,但是W3Perl产生的统计量更less。

我build议你这些链接的进一步信息:

http://www.aardal.com/stats/docs/uk/speed.html
http://www.w3perl.com/
http://awstats.sourceforge.net/

我的build议是:

  • W3Perl如果你想粒度统计,并没有太多的日志文件GB
  • AWStat在你需要的情况下没有太多的GB文件,你想要一个很好的graphics表示。
  • Webalizer如果你有大量的日志文件进行分析。
  • 模拟如果你需要真正准确的统计数据,巨大的日志文件,你有C开发经验(或者你知道任何人可以帮助)。

关于页面标记胜利者肯定是谷歌分析,收集和生成的数据比其他解决scheme更好,但有一天可能会发生,谷歌会问钱… …

W3Counter和Xiti是需要你的免费版本,在你想要监控的每个网页上安装一个图像。 两者都适用于小型网站。

开放式Web分析和Pikwik是伟大的开源解决scheme。 两者都相当成熟和稳定,但它们需要MySQL数据库和PHP支持。

如果您不需要“自制”解决scheme,我肯定会select使用Google Analytics,而在开源项目之间,我会selectOpen Web Analytics,因为它比Piwik更成熟。

我对piwik非常满意。 我只是错过了调整依赖于网站的小部件的可能性。 我用它来检查我的drupal网站,也有一个drupal的模块。

为了我的钱,最好的日志分析工具是模拟的 。 这是一个前剑桥统计学家编写的一个非常有用的页面,它告诉你 – 和你的pipe理层 – 从你的web日志中可以不能正确地知道什么,它是令人吃惊的快速模数DNS查找,离奇的商业索赔尽pipe如此。

虽然我不能评论页面标签, 抱歉。

这是实验性的软件,但是相当令人印象深刻:

蜂鸟让你看到游客如何与您的网站实时交互。 “实时”并不意味着每隔5分钟刷新一次 – WebSockets使蜂鸟每秒更新20次。 蜂鸟build立在Node.js之上,一个新的JavaScriptnetworking工具包,可以处理大量的stream量和许多并发用户。

我会说(虽然我有点偏向共同创始人;-)), SnowPlow是目前最强大的基于开源标签的网站分析工具。

SnowPlow采用松散耦合的分布式架构,使用Hadoop和Hive,因此它可以扩展到数百万乃至数十亿个事件 – 这是MySQL或其他基于RDBMS的解​​决scheme无法做到的。

SnowPlow的另一个重大创新是您的事件数据存储在一个干净的,不可变的,非规范化的primefaces“平面文件”结构中 – 换句话说就是一个分析数据仓库。 这使得使用Hive进行大量非常复杂的分析,以及与第三方数据(例如CRM或销售数据)的直接连接成为可能。 同样,这比其他解决scheme更强大,这些解决scheme倾向于将primefaces数据折叠成聚合体,截断旧数据或使用头部划痕的标准化结构,这些结构很难直接查询或join其他来源。

您可以在这里阅读更多关于SnowPlow的技术架构 。

Boomerang是用于客户端性能分析的最佳工具 – 但它只是js代理 – 我不知道任何现成的报告工具,对于已经提到的networking工具Piwik和AwStats, 它是有用的。 模拟是一个非常类似于AwStats的工具 – 不易configuration,但处理速度更快。

如果你正在寻找自己的解决scheme,有免费的IP地址数据可用

我知道使用Webalizer进行网站日志分析的人员。 只是再提一个选项。

还有关于可能性的讨论。

经过对开放源代码networking分析软件包的一些研究,我认为明确的获奖者是http://www.openwebanalytics.com和http://piwik.org/

原因是易于使用,安装实时function。

我想提到的一个令人印象深刻的function是由openwebanalytics生成的热图。