0

1) 我参考了https://github.com/evolvingweb/ajax-solr/wiki/reuters-tutorial的 Ajax-Solr 设置。

我想知道,虽然 ajax-solr 正在运行,但它只在路透社数据下搜索。如果我想使用 nutch 抓取网络并将其与 solr 集成,那么我必须将 solr 的 schema.xml 文件替换为 nutch 的 schema.xml 文件,该文件将不符合 ajax-solr 配置。通过替换 schema.xml 文件,ajax-solr 将无法工作(如果我错了,请纠正我)!!!

我现在如何将 Solr 与 Nutch 以及 Ajax-Solr 集成,以便 ajax-Solr 也可以搜索网络上的其他数据?

2) 请问有没有Solr搜索的前端API,除了Ajax-Solr,可以帮助爬​​取网页的高效搜索?

4

1 回答 1

1
  1. 看多核的Solr,最好不要尝试在一个集合中混合不同性质的文档
  2. SOLR 的 API 有很多,例如 Java 的 SOLRJ ( http://wiki.apache.org/solr/Solrj ), PHP 的 SolPHP ( http://wiki.apache.org/solr/SolPHP ) 等等。
于 2012-07-15T12:28:23.743 回答