我希望将搜索功能添加到现有的完全静态网站中。很可能,新的搜索功能本身需要是动态的,因为搜索索引需要定期更新(当人们对静态内容进行更改时),并且搜索结果需要在用户与之交互时动态生成. 我希望使用 Python 添加此功能,因为这是我的首选语言,尽管我对想法持开放态度。
在这种情况下,Google Web Search API 将不起作用,因为被索引的内容位于专用网络上。Django haystack 不适用于这种情况,因为这需要将内容存储在 Django 模型中。一个名为 mnoGoSearch 的工具可能是一种选择,因为我认为它可以像谷歌那样爬取网站,但我不确定该项目的活跃程度;项目网站似乎有点过时了。
我对使用 Solr、ElasticSearch 或 Whoosh 等工具感到好奇,尽管我相信这些工具只是索引引擎,不处理搜索内容的解析。有没有人对如何索引静态 html 内容以作为一组搜索结果进行检索有任何建议?感谢您的阅读和您的任何反馈。