我apache-nutch-2.1
用来爬行。是否可以将爬取的结果作为 json 获取?我编写了一个使用 apache-nutch-2.1 进行爬网的 java 程序。我将如何将爬取的结果作为 JSON 检索。这可能是一个愚蠢的问题,但是当我用谷歌搜索它时。与此无关。
如何添加我得到爬取结果的 json?
我apache-nutch-2.1
用来爬行。是否可以将爬取的结果作为 json 获取?我编写了一个使用 apache-nutch-2.1 进行爬网的 java 程序。我将如何将爬取的结果作为 JSON 检索。这可能是一个愚蠢的问题,但是当我用谷歌搜索它时。与此无关。
如何添加我得到爬取结果的 json?
您正在寻找的功能已经实现:Nutch-932 retrieve crawl results as JSON
上面的链接中还有如何使用它的示例。