Sqoop 与 HCatalog 导入一起使用时,即使在使用 Oracle 运行 Apache Sqoop 时在命令中使用了 --hive-drop-import-delims 选项后,也无法从列数据中删除新行 (\n)。
Sqoop 查询:
sqoop import --connect jdbc:oracle:thin:@ORA_IP:ORA_PORT:ORA_SID \
--username user123 --password passwd123 -table SCHEMA.TBL_2 \
--hcatalog-table tbl2 --hcatalog-database testdb --num-mappers 1 \
--split-by SOME_ID --columns col1,col2,col3,col4 --hive-drop-import-delims \
--outdir /tmp/temp_table_loc --class-name "SqoopWithHCAT" \
--null-string ""
Oracle Column col4中的数据如下:(数据有^M等控制字符)
<li>Details:^M
<ul>^M
<li>
控制字符是否会导致此问题?
我错过了什么吗?这个问题有什么解决方法或解决方案吗?