0

我同时通过 Lucene 进行索引。5k 个文档,每个文档大约有 5k 个文档。大小 20kB,我需要通过 updateDocument 方法经常更新它们。

我正在使用 NRT,其中最多可能有 50 个线程更新文档。在 100 次更新/插入或 10 分钟超时后,提交在单独的线程中完成。

到目前为止,每个文档更新的平均持续时间为 1 秒,最终达到峰值(80 秒,需要分析具体文档)。

有人可以告诉我应该使用什么策略/优化来加速文档更新吗?

4

1 回答 1

0

我发现当应用程序要求使用最新的阅读器时,NRT 会刷新内存文档,这从索引的角度来看并没有好处。

切换到正常索引并更改刷新策略以由项目计数而不是内存来处理,因为更大的文档会导致频繁刷新。

于 2013-03-29T10:39:23.270 回答