我认为标题中的问题说明了一切并且很笼统。
我也可以举一个具体的例子:
我已经标记了文章,并希望找到similar
带有与之关联的标签的文章。
score 函数将查看两篇文章并计算共同标签的数量。
由于分数没有存储在任何地方,每次我需要在给定文章的情况下查找类似文章时,我都必须计算分数。
But this is too expensive.
- 一般来说,这类问题的常见解决方法是什么?
tag
对于我的具体问题有更好的方法吗?(例如solr 的 moreLikeThis)
编辑
我正在使用 postgres,如果这很重要。
我正在寻找人们成功使用的通用解决方案,例如you should batch calculate the score and save it somewhere
等等......