-1

如果可能的话,我需要在一个项目中使用开源 rss 爬虫和提要阅读器(或两个不同的工具)。我见过很多不同的工具,你知道哪一个是最好的吗?

提前致谢

4

1 回答 1

2

如果您想要完整的搜索引擎,请查看Apache Nutch

如果您只是想了解网络爬虫的原理 - 请阅读“编程集体智能”中的非常简单的介绍和“信息检索简介”中的更高级介绍。

如果您需要解析 rss 和 atom 提要,请使用Rome

还要查看任何刮板,例如Web-Harvest

于 2012-09-13T13:35:04.143 回答