0

我正在学习 Apache Lucene,我对索引的性能有一些疑问,

  1. 我正在根据数据库中的数据构建索引,数据库的架构是 Lucene 文档的架构。
  2. 我有两个选项可以回复搜索。首先是搜索索引并用索引响应值,否则搜索索引,获取结果的id(即表的主键)并查询数据库。对于前者,我需要将表的值存储在索引中,以便我可以使用 Index.Store.Yes 检索值,而对于后者,它足以索引数据而不是使用 Index.Store 存储数据。不,所以索引不会更大。
  3. 使用前一种技术会影响性能(通过存储所有值来搜索索引)或搜索索引并查询数据库(通过存储所有值)会影响性能。
  4. 哪个是最好的方法,或者是否有任何其他解决方案可以解决上述问题
4

2 回答 2

1

这真的取决于,如果您要拥有一个庞大的数据集,通常最好保持索引尽可能轻,并按照您的描述查询数据库。但是,如果数据集很小,也可以存储它们......

于 2012-07-26T09:11:07.603 回答
0

Apache Lucene 中搜索操作的性能取决于索引文件的权重。尽量保持轻量。那么在你的情况下,我建议对这两种情况进行时间戳测试。至少进行 20 次以上的观察。计算一个平均值。然后得到的统计数据肯定会帮助您做出决定。

于 2013-07-05T05:26:07.233 回答