我正在运行 Ubuntu 14.04,我试图让一个基本的 Nutch Web Crawl 运行无济于事。按照本教程,我设置了以下构建块:
- Ubuntu 14.04
- HBase 0.90.4
- Nutch 2.2.1
- 索尔 4.3.1
我确认 HBase 和 Solr 都在运行,我填充了urls/seed.txt
文件。然后当我打电话时;
bin/nutch inject urls
我看到了以下输出,然后看起来 Nutch 只是挂起。
InjectorJob: starting at 2014-06-09 23:38:49
InjectorJob: Injecting urlDir: urls/seed.txt
这个stackoverflow问题似乎与我的相似,但是我不在代理后面,所以答案不适用。
解决此问题的任何帮助将不胜感激。