当nutch在索引阶段完成它的循环(即抓取-获取-解析-索引)时,我不希望nutch索引(lucene索引),但我希望nutch放置所有爬取的数据(我相信他将它们保留为NutchDocument对象)使用我的代码进入 mysql。
有没有办法做到这一点?
谢谢
当nutch在索引阶段完成它的循环(即抓取-获取-解析-索引)时,我不希望nutch索引(lucene索引),但我希望nutch放置所有爬取的数据(我相信他将它们保留为NutchDocument对象)使用我的代码进入 mysql。
有没有办法做到这一点?
谢谢