我同时通过 Lucene 进行索引。5k 个文档,每个文档大约有 5k 个文档。大小 20kB,我需要通过 updateDocument 方法经常更新它们。
我正在使用 NRT,其中最多可能有 50 个线程更新文档。在 100 次更新/插入或 10 分钟超时后,提交在单独的线程中完成。
到目前为止,每个文档更新的平均持续时间为 1 秒,最终达到峰值(80 秒,需要分析具体文档)。
有人可以告诉我应该使用什么策略/优化来加速文档更新吗?
我同时通过 Lucene 进行索引。5k 个文档,每个文档大约有 5k 个文档。大小 20kB,我需要通过 updateDocument 方法经常更新它们。
我正在使用 NRT,其中最多可能有 50 个线程更新文档。在 100 次更新/插入或 10 分钟超时后,提交在单独的线程中完成。
到目前为止,每个文档更新的平均持续时间为 1 秒,最终达到峰值(80 秒,需要分析具体文档)。
有人可以告诉我应该使用什么策略/优化来加速文档更新吗?