我正在使用 Sqoop 1.4.2 版和 Oracle 数据库。
运行 Sqoop 命令时。例如像这样:
./sqoop import \
--fs <name node> \
--jt <job tracker> \
--connect <JDBC string> \
--username <user> --password <password> \
--table <table> --split-by <cool column> \
--target-dir <where> \
--verbose --m 2
我们可以指定--m - 我们希望 Sqoop 运行多少并行任务(它们也可能同时访问数据库)。相同的选项可用于 ./sqoop export <...>
是否有一些启发式方法(可能基于数据大小)有助于猜测要使用的最佳任务数量是多少?
谢谢!