3

我希望对 PostgreSQL、SQLServer 和 Lucene 中的全文搜索索引进行一些基准测试。

关于在哪里找到一个好的大样本数据库来执行查询的任何想法?

提前非常感谢。

4

1 回答 1

2

我认为最好的来源是维基百科的数据库转储,因为它们包含大量的文本。它们可以在这里找到: http: //dumps.wikimedia.org/

您也可以尝试使用 usenet 存档,但选择目标语言更难,使用的语言质量也较低。

于 2011-02-24T08:42:04.130 回答