我可以使用 Sqoop 成功地从 MySQL 增量导入到 HDFS
sqoop job -create JOBNAME ... --incremental append --check-column id --last-value LAST
sqoop job -exec JOBNAME
以日志消息结束,例如
INFO tool.ImportTool: Saving incremental import state to the metastore
INFO tool.ImportTool: Updated data for job: JOBNAME
并且检查作业会发现 incremental.last.value 已正确更新。
如果我尝试相同的过程,但将“--hive-import”添加到我的作业定义中,它将成功执行,但不会更新incremental.last.value。
这是一个错误吗?预期行为?有没有人有从 MySQL 增量导入数据并通过 Hive 提供数据的程序?
我基本上希望我的 Hadoop 集群成为我的 MySQL 数据库的读取从属,以便快速分析。如果除了 Hive 之外还有其他解决方案(Pig 会很好),我也很想听听。