我正在使用 PySolr 运行我的搜索。我想索引一个 rss 提要,想知道这是否可以使用 PySolr,如果可以,你是如何做到的。
我在http://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Example找到了有关如何在 Solr 中执行此操作的说明
但找不到任何关于如何在 PySolr 中执行等效操作的信息
谢谢
我正在使用 PySolr 运行我的搜索。我想索引一个 rss 提要,想知道这是否可以使用 PySolr,如果可以,你是如何做到的。
我在http://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Example找到了有关如何在 Solr 中执行此操作的说明
但找不到任何关于如何在 PySolr 中执行等效操作的信息
谢谢
你可能不需要在 PySolr 中做同样的事情。如果您已经有 Solr 索引提要,按照示例,那么您只需使用 PySolr 来查询该索引。就像是:
from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
do_stuff_with(result)
如果你真的想从 Python 端来做,那么你需要在那里获取和解析 RSS(使用其他库,例如Universal Feed Parser);PySolr 只是包装了与 Solr 的交互,它不“做”数据源。
您可能想查看Haystack,它使用 PySolr(并且可以使用其他引擎)并巧妙地抽象了创建搜索索引条目并将它们发送到 Solr 进行索引的工作。