2

我想知道是否有人对类似于 mnogosearch 的 Python 全文搜索引擎有任何建议。我试图让它像 Mnogosearch 一样运行,但不确定与其他选项相比如何(如果有更好的选项)。

例如,Haystack 似乎在索引您指定的 Django 模型字段方面做得很好,但我不确定它是否可以搜索网站的全部内容。

Solr/Lucine 看起来很有希望,但我对它不太熟悉。Whoosh 似乎也可能是一个有趣的选择,但我想知道 Python 实现是否会使其变慢?

我对搜索很陌生,所以我试图围绕不同的选项。有没有人对哪些搜索技术可以很好地为整个网站编制索引有什么好的意见?

谢谢阅读。任何意见都非常感谢。

4

1 回答 1

2

恕我直言 Solr 可能是最好的选择,无论是性能还是功能,它都基于经过严格测试的技术。如果你正在寻找一个纯 Python 解决方案 Whoosh 看起来不错 - 我没有在生产中使用它,只是检查了它并查看了代码。它可能会更慢,但我怀疑它对于在搜索功能上获得较少流量的网站来说是显而易见的。whoosh 的一个不错的功能是 BM25F 的实现,它可以考虑网站结构,例如标题/页眉/正文/页脚等,并且在通用网络搜索模型中被认为是最先进的。

如果您使用的是 Django,据我所知,Haystack 会让您更改搜索引擎后端,就像您可以更改 RDBMS 后端一样。

我不确定您所说的“整个网站内容”到底是什么意思。如果您网站的大部分页面内容不是从模型内容生成的,那么使用集成搜索索引可能不是最佳选择,可能是IndexTank或 Google 站点搜索之类的。但在相反的情况下,如果您不熟悉任何一种搜索技术,我会推荐 haystack,因为它会让您的生活更轻松。

于 2011-04-18T15:34:54.423 回答