使用 hadoop 通用选项应该足够简单 - 我假设您已经${HADOOP_HOME}/conf
为集群配置了内容(即 core-site.xml 和 mapred-site.xml)
exec ${HADOOP_HOME}/bin/hadoop com.cloudera.sqoop.Sqoop \
-libjars myjar1.jar,myjar2,jar "$@"
在这里,您通过-libjars
选项传递要放置在类路径中的 jar。
如果您有多个要定位的集群,那么您只需为每个集群创建不同的 conf 文件夹并HADOOP_CONF_DIR
在调用 hadoop 脚本之前设置环境变量,或者您可以使用-Dkey=value
通用参数来适当地设置fs.default.name
和mapred.job.tracker
:
exec ${HADOOP_HOME}/bin/hadoop com.cloudera.sqoop.Sqoop \
-libjars myjar1.jar,myjar2,jar \
-Dfs.default.name=hdfs://namenode-servername:9000 \
-Dmapred.job.jobtracker=jobtracker-servername:9001 \
"$@"