我是 hadoop 和巨兽的新手,我按照https://github.com/DigitalPebble/behemoth/wiki/tutorial上的教程使用以下命令为文本文档生成巨兽语料库:
sudo bin/hadoop jar /home/madhumita/behemoth/core/target/behemoth-core-*-job.jar com.digitalpebble.behemoth.util.CorpusGenerator -i /home/madhumita/Documents/testFile -o /home/madhumita /巨兽/testGateOpCorpus
我收到错误消息:
错误 util.CorpusGenerator:输入不存在:/home/madhumita/Documents/testFile
每次我运行命令时,虽然我已经用 gedit 检查了路径是否正确。我在网上搜索了任何类似的问题,但我找不到任何类似的问题。关于它为什么会发生的任何想法?如果 .txt 文件格式不可接受,那么所需的文件格式是什么?