我每天(通过 wget)将 5 个文件保存到 /tmp,以便在 bash 脚本中加载到 hdfs。
donaldDuck-2013-07-20.zip
mickeyMouse-2013-07-20.zip
goofyGoof-2013-07-20.zip
plutoStar-2013-07-20.zip
bigBadWolf-2013-07-20.zip
文件名的日期部分是动态的。
然后我如何告诉hadoop加载5个文件中的每一个?我听说了一些关于循环的事情。
for file in /tmp/*; do
echo "Running ${file##*/} ...."
done
我是否将 echo 行替换为“hadoop fs -put ...”语句?它会是什么样子?