1

我有一个应用程序,它使用 Apache Nutch 2.1 抓取网站并将数据持久化到 MySQL。我必须集成 Nutch 和 Solr,这不是问题,因为互联网上有足够的文档可用。

从网页存储内容后,我想添加基于 Solr 的搜索功能。我需要在网页中搜索关键词。例如,如果我正在爬取与电影相关的网站,并且我想从爬取的数据中搜索任何特定的电影(作为关键字),那么我需要对 Solr 配置进行哪些更改。我需要完全编写一个单独的插件还是可以使用现有的插件?我必须将什么类型的索引添加到 solr 配置中?

4

0 回答 0