Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一个应用程序,它使用 Apache Nutch 2.1 抓取网站并将数据持久化到 MySQL。我必须集成 Nutch 和 Solr,这不是问题,因为互联网上有足够的文档可用。
从网页存储内容后,我想添加基于 Solr 的搜索功能。我需要在网页中搜索关键词。例如,如果我正在爬取与电影相关的网站,并且我想从爬取的数据中搜索任何特定的电影(作为关键字),那么我需要对 Solr 配置进行哪些更改。我需要完全编写一个单独的插件还是可以使用现有的插件?我必须将什么类型的索引添加到 solr 配置中?