我想为我的网站建立一个搜索引擎,以便我可以快速找到相关内容。我做了很多谷歌搜索,发现了 ElasticSearch 和 Solr(它们都位于 Lucene 之上)和 whoosh(基于 python)。
但是所有这些搜索引擎都只是在数据之上构建一个“倒排索引”吗?获得更高质量搜索的其他算法方法是什么?
我对这篇在 Solr 之上使用协同过滤的博客文章很感兴趣,它会返回相关的搜索查询:
http://www.opensourceconnections.com/2013/08/25/semantic-search-with-solr-and-python-numpy/
还有其他我应该注意的常用技术吗?是否有其他库位于 ElasticSearch/Solr 之上,我可以插入并使用“开箱即用”?
任何链接或提示将不胜感激!