1

我想为多个域创建自定义搜索引擎。
如何使用 solr 和 nutch 为 500 多个域创建自定义搜索,同时搜索每个域应该能够显示自己的数据。

例如
example.com exapmle2.com example3.com 等等,当用户在 example.com 上搜索时,他应该获得属于 example.com 的数据,与 example2.com 等相同

这些网站可能是博客文章、电子商务网站、分类网站或酒店预订网站。

任何建议将不胜感激。

4

1 回答 1

1

这应该是开箱即用的。当您使用 nutch 架构索引到 solr 时,它有一个名为 site 的字段来存储域。在搜索界面(您将构建的)上,当您选择一个域(又名站点)时,您只需传递一个过滤查询,如“site:domain”,以便将结果限制在搜索的域中。

注意:如果您想限制对注入域的抓取,请确保将 nutch 中的外部链接属性设置为 false。

希望这能回答你的问题。

于 2012-07-29T15:43:58.087 回答