1) 我参考了https://github.com/evolvingweb/ajax-solr/wiki/reuters-tutorial的 Ajax-Solr 设置。
我想知道,虽然 ajax-solr 正在运行,但它只在路透社数据下搜索。如果我想使用 nutch 抓取网络并将其与 solr 集成,那么我必须将 solr 的 schema.xml 文件替换为 nutch 的 schema.xml 文件,该文件将不符合 ajax-solr 配置。通过替换 schema.xml 文件,ajax-solr 将无法工作(如果我错了,请纠正我)!!!
我现在如何将 Solr 与 Nutch 以及 Ajax-Solr 集成,以便 ajax-Solr 也可以搜索网络上的其他数据?
2) 请问有没有Solr搜索的前端API,除了Ajax-Solr,可以帮助爬取网页的高效搜索?