如何创build一个大样本数据库?

我有几个样本数据库,但他们的规模很小。 我想创build一个数据库高达50GB的logging。 我想学习数据库的许多方面,也想要testing我们的应用程序的性能。

如何收集随机数据?

互联网上的许多资源允许你下载他们的内容,而且通常会达到GB的10或100。 我能想到的两点是:

尽pipe这些转储是用XML编写的,但是通过任何现代的RDBMS都可以轻松地将其导入到一个空的数据库中。 其他一些网站也有转储,尤其是wiki-ish网站(就像这两个例子)。

只需编写大量适当的随机数据插入。

因为你没有告诉我们关于你的数据库的事情,所以我不能再具体了。

你可以使用一些像这样的“Faker”API: http : //faker.rubyforge.org/

或者如果你想要真正的数据,你可以从互联网上收集,几个月前我需要真实的数据进行testing,我做了一个IRC机器人,loggingFreenode十大频道的所有消息,并让它运行24小时星期,这给了我很多数据(〜100万行):)