0

我们已经建立了一个使用 Lucene.NET 进行搜索的网站。我们最近整合了另一个网站,从用户的角度来看,这两个网站似乎只是一个网站!(我们共享母版等)

我们遇到的问题是两个网站托管在不同的位置。因此,当 Lucene.NET 抓取第一个网站时,它不会选择第二个网站的内容。我们想从第二个网站提取内容并将其放入为第一个网站构建的同一索引文件中。

如何让 Lucene.NET 也抓取外部站点?

谢谢

4

1 回答 1

0

如果您对第二个系统具有文件系统访问权限,则可以通过提供路径进行索引。如果没有,您将需要编写一个爬虫,您可以使用 HttpWebRequest 从一些基本的东西开始,或者通过使用一些使用链接等递归爬取站点的工具来获得更高级的东西。

于 2012-07-12T10:58:45.810 回答