如何将增量数据加载到分区的配置单元表中
我有包含以下列的表“用户”,我创建了基于 created_on 字段的配置单元分区
id bigint,
name string,
created_on string(yyyy-MM-dd),
updated_on string
我创建了一个 sqoop 作业以根据上次修改日期增量导入
sqoop job --create users -- import --connect jdbc:mysql://<ip>/product --driver com.mysql.jdbc.Driver --username <> -P --table users --incremental lastmodified --check-column updated_on --last-value "2016-11-15"--hive-table users --hive-import --hive-partition-key created_on --hive-partition-value "2016-11-15" --m 1
如果您观察上述作业,这将根据上次修改的值获取并插入错误的分区
有没有解决这个问题的方法