我知道网络上以及 SO 上有几个关于 Lucene 中的索引和查询性能的主题,但我还没有找到一个讨论创建有效负载是否(如果是,多少?)会影响查询表现...
这是场景...
假设我想索引一组文档(从 100K 到 10M),并且每个文档都有一个我希望能够单独搜索的子部分(或者可能排名更高,取决于是否在该部分中找到匹配项) .
我正在考虑向该小节中出现的任何术语添加有效负载(在索引期间),因此我可以在查询时有效地做出决定。
有谁知道与使用有效负载相关的任何性能问题,甚至更好,您能否指出有关此主题的任何在线文档?
谢谢!
编辑:我很欣赏我的场景的替代解决方案,但如果我将来确实需要使用有效负载,是否有人对关于查询性能的原始问题有任何评论?