1

我正在使用 PySolr 运行我的搜索。我想索引一个 rss 提要,想知道这是否可以使用 PySolr,如果可以,你是如何做到的。

我在http://wiki.apache.org/solr/DataImportHandler#HttpDataSource_Example找到了有关如何在 Solr 中执行此操作的说明

但找不到任何关于如何在 PySolr 中执行等效操作的信息

谢谢

4

1 回答 1

2

你可能不需要在 PySolr 中做同样的事情。如果您已经有 Solr 索引提要,按照示例,那么您只需使用 PySolr 来查询该索引。就像是:

from pysolr import Solr
solr = Solr('http://localhost:8983/solr/rss/')
response = solr.search('some query string')
print response.hits
for result in response.docs:
    do_stuff_with(result)

如果你真的想从 Python 端来做,那么你需要在那里获取和解析 RSS(使用其他库,例如Universal Feed Parser);PySolr 只是包装了与 Solr 的交互,它不“做”数据源。

您可能想查看Haystack,它使用 PySolr(并且可以使用其他引擎)并巧妙地抽象了创建搜索索引条目并将它们发送到 Solr 进行索引的工作。

于 2010-01-28T22:33:30.823 回答