我需要将 RDBMS 表中的数据导入远程 Hive 机器。我怎样才能使用 Sqoop 实现这一点?
简而言之,如何在导入命令中指定 hive 数据库名称和 hive 机器 i/p?
请帮助我使用适当的 sqoop 命令。
您应该在sqoop
安装了 Hive 的机器上运行该命令,因为sqoop
会寻找$HIVE_HOME/bin/hive
执行 theCREATE TABLE ...
和其他语句。
或者,您可以使用sqoop
命令--hive-home
行选项来指定 Hive 的安装位置(只是覆盖$HIVE_HOME
)
要连接到远程 RDBMS:
sqoop import --connect jdbc:mysql://remote-server/mytable --username xxx --password yyy
要导入 Hive:
sqoop import --hive-import
您可以通过查看 http://archive.cloudera.com/cdh/3/sqoop/SqoopUserGuide.html#_literal_sqoop_import_literal">此链接获得更全面的命令列表。