我已经有一个名为角色的配置单元表。我需要使用来自 mysql 的信息更新此表。所以,我使用这个脚本认为它会在我的蜂巢表上添加和更新新数据:`
sqoop import --connect jdbc:mysql://nn01.itversity.com/retail_export --username retail_dba --password itversity \ --table roles --split-by id_emp --check-column id_emp --last-value 5 --incremental append \ --target-dir /user/ingenieroandresangel/hive/roles --hive-import --hive-database poc --hive-table roles
不幸的是,这只会插入新数据,但我无法更新已经存在的记录。在你问几个陈述之前:
该表没有PK
如果我不指定 --last-value 作为参数,我将获得那些已经存在的重复记录。
如果不应用截断表或使用 PK 重新创建表,我怎么能弄清楚呢?存在方式?
多谢你们。