Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在构建一个搜索引擎,需要爬网、索引它并能够搜索数据。
我可以单独使用 Apache Solr 还是首先需要 Nutch 来爬网?
您需要一个爬虫来收集内容,以便 Solr 可以对其进行索引。Nutch和Crawl Anywhere与 Solr 配合得很好。
Solr 是索引器,Nutch 是 Crawler!他们不能做彼此的工作!如果你想要一个搜索引擎,你必须有一个爬虫和一个索引器!您可以更改它们,甚至可以为此创建自己的应用程序!