工具在linux命令行中做统计

说我运行一个命令,输出空间分隔线上的值。 其中一些是数字。 有没有可用于计算这些数字的平均值,中位数,标准差的效用? 像“切”,但输出这些统计数据。

看看st: https : //github.com/nferraz/st或者sta(推荐): https : //github.com/simonccarter/sta

从GitHub:

STA

来自命令行界面(CLI)的简单统计,速度很快。 描述

这是从命令行计算基本描述性统计的轻量级快速工具。 受到https://github.com/nferraz/st的启发,这个项目的不同之处在于它是用C ++编写的,允许在给定较大的非平凡数据集的情况下更快速地计算统计信息。

补充包括有偏估计和无偏估计的select,以及使用补偿variablesalgorithm的选项。

给定1,000,000个升序数字的文件,使用Bash时间对2.5GHz双核MacBook进行的简单testing表明,使用st的时间less于1秒。

你也可以考虑使用clistats 。 这是一个高度可configuration的命令行界面工具,用于计算分隔input数字stream的统计数据。

I / O选项

  • input数据可以来自文件,标准input或pipe道
  • 输出可以写入文件,标准输出或pipe道
  • 输出使用以“#”开头的标题来启用pipe道到gnuplot

parsing选项

  • 信号,文件结束或空白行检测停止处理
  • 注释和分隔符可以设置
  • 列可以从处理中过滤掉
  • 行可以基于数字约束从处理中过滤掉
  • 行可以基于string约束从处理中过滤掉
  • 初始标题行可以被跳过
  • 固定的行数可以被处理
  • 重复的分隔符可以被忽略
  • 行可以重新排列成列
  • 严格强制只处理相同大小的行
  • 包含列标题的行可用于标题输出统计

统计选项

  • 汇总统计(计数,最小值,平均值,最大值,标准偏差)
  • 协方差
  • 关联
  • 最小二乘抵消
  • 最小平方斜率
  • 直方图
  • 过滤后的原始数据

注意:我是作者。

R语言将是完美的。 它运行在terminal,它免费,也许是最stream行的统计语言。 所以,它有大量关于如何做整齐的事情的文件,包括你所要求的。