我希望对 PostgreSQL、SQLServer 和 Lucene 中的全文搜索索引进行一些基准测试。
关于在哪里找到一个好的大样本数据库来执行查询的任何想法?
提前非常感谢。
我希望对 PostgreSQL、SQLServer 和 Lucene 中的全文搜索索引进行一些基准测试。
关于在哪里找到一个好的大样本数据库来执行查询的任何想法?
提前非常感谢。
我认为最好的来源是维基百科的数据库转储,因为它们包含大量的文本。它们可以在这里找到: http: //dumps.wikimedia.org/
您也可以尝试使用 usenet 存档,但选择目标语言更难,使用的语言质量也较低。