1

我需要使用 lucene 测试全文索引和搜索,为此我正在寻找大量各种类型的文件(大约 15 Gb)(pdf、doc、txt、xml、json ......)。

我已经尝试过维基百科的数据库,但那些只给了我一个 xml 文件。

任何人都可以建议我在哪里找到这样的数据库?

4

1 回答 1

1

您可以尝试将全文搜索与 InnoDB 一起使用。虽然使用http://dumps.wikimedia.org/会更好。

于 2012-11-29T18:48:03.213 回答