我最近开始sqoop - hive/hadoop
在 Linux 上工作。我必须将 hive 数据从一个表导入到 oracle 表。我正在使用简单sqoop
的导出来执行此操作。我在蜂巢表中有 600 万行。
这个命令给了我很差的性能并且需要很长时间(85 分钟)才能完成这项工作。
查询 ->
sqoop export --connect jdbc:oracle:thin:@server:port:db--username user --password password--export-dir /user/hive/warehouse/tb --table tb--columns 'col1,col2..col33' --input-fields-terminated-by ',' --input-null-string '\\N' --input-null-non-string '\\N' -m 1
是否有任何配置更改可以帮助我加快速度。