当我以本地模式在 Ubuntu 上将 Nutch 抓取作为后台进程运行时,Fetcher 因挂起线程而中止。消息类似于:
WARN fetcher.Fetcher - 使用“X”挂起线程中止。
我使用 nohup 和 & 启动脚本,因为我想从会话中注销并让爬虫仍然在服务器上运行。否则,当爬网在某个深度完成并且正在更新 crawldb 时,SSH 会话会超时。我试过在没有太多帮助的情况下配置“保持活力”消息。该命令类似于:
nohup ./bin/nutch crawl ....... &
以前有人经历过吗?似乎只有当我使用 nohup 或 & 时才会发生。