1

我有一个包含 150,000 篇新闻文章的新闻网站。每天大约有 250 篇新文章以 5-15 分钟的间隔添加到数据库中。我知道 Solr 针对数百万条记录进行了优化,我的 150K 不会成为问题。但我担心频繁更新会成为问题,因为每次更新都会使缓存失效。在我的开发服务器中,页面的冷加载需要 5-7 秒才能加载(因为每个页面都运行一些 MLT 查询)。

如果我将索引分成两部分 - 存档索引和最新索引,它会有所帮助。归档索引将每天更新一次。

任何人都可以建议任何方法来优化我的安装以不断更新索引吗?

谢谢

4

2 回答 2

1

我的答案是:测试一下!如果您不知道它的性能如何,请不要尝试优化。就像你说的,150K 不是很多,为你的测试建立一个这样大小的索引应该很快。之后,从不同的并发线程(以模拟用户)运行几个 MLT 查询,同时索引更多文档以查看其行为方式。

您应该注意的一项设置是自动提交。由于您不断地进行索引,因此您不能在每个文档上提交(您将关闭 Solr)。您为此设置选择的值将允许您调整系统的延迟(新文档在结果中返回所需的次数),同时保持系统响应。

于 2010-07-13T16:13:30.060 回答
0

Consider using mlt=true in the main query instead of issuing per-result MoreLikeThis queries. You'll save the roundtrips and so it will be faster.

于 2010-07-16T03:20:24.377 回答