3

我想将爬取的网站索引到 ElasticSearch,但我不知道我可以使用 php 爬虫将爬取的信息索引到 ElasticSearch。我知道 Apache nutch 可以将爬取的网站索引到 ElasticSearch,但我对 php 爬虫一无所知!
是否有任何性能良好且可以将爬取的网站索引到 ElasticSearch 的 php 爬虫?
帮助我为我的项目选择 php 爬虫,我可以将它与 ElasticSearch 集成。
我可以将 Apache nutch 与 php Web 应用程序一起使用吗?

4

1 回答 1

2

一探究竟 :

我想,最好使用 PHP 爬虫,因为您可以控制索引私有内容并更准确地检测修改。

于 2014-02-13T10:31:50.387 回答