1

我有一个 solr 索引,其中包含大约 1000 万个网络讨论线程。Solr 在读写器模式下运行。我有另一个进程查询 solr 以获取不同的关键字查询。关键字可以是以下格式:

  1. 一个
  2. A和B和C......
  3. A AND B AND C.... AND Z NOT AA NOT AB NOT AC......

最终的 Solr Query 有点像这样

text:( "Keyword A" OR "Keyword B" OR "Keyword C" ...) AND source: (source1 OR source2 OR source3...) AND date:[date1 TO date2] 

在 solr 上查询了大约 100 种不同的组合。查询组合的选择取决于它返回的每个查询的结果数。

不知何故,查询似乎需要很多时间。有时只需几分钟(2 - 15 分钟)。缓存的使用似乎很困难,因为很少有查询被调度线程背靠背拾取。

如何减少 Solr 查询所需的时间?

4

0 回答 0