在将文件从大型机以 ORC 格式加载到 Hadoop 中时,一些数据使用单引号(')加载并保留为双引号(“)。但完整的源文件在单引号(')中。指定使用的自定义分隔符Hive Cobol Serde。
例子:
源数据:
名字 姓氏 地址
Rev 'Har' O'Amy 4031 'B' Ave
加载到 Hadoop 作为,一些具有正确格式(')的数据和一些带有双引号(“)的数据如下:
名字 姓氏 地址
Rev "Har" O"Amy 4031 "B" Ave
可能是什么问题以及如何解决这个问题?