我写了一个程序来在 MySQL 中存储 nutch(2.1) 爬取的结果。它工作正常。我得到了为搜索指定的文件格式。我得到几个jpeg
文件。我想从数据库中获取这些图像(我不确定它们是否被存储)。我有一个带有图像 URL 的字段。我可以去那里取。但是,nutch 在 MySQL 中存储这么多数据有什么用。你能帮我解决这个问题吗?
我正在使用以下代码:
String crawlArg = "urls -threads 5";
// Run Crawl tool
try {
ToolRunner.run(NutchConfiguration.create(), new org.apache.nutch.crawl.Crawler(),
tokenize(crawlArg));
} catch (Exception e) {
e.printStackTrace();
return;
}
请询问您可能需要的更多详细信息。我是新手。