我有一个 CSV 数据,每个字段都用双引号括起来。当我创建 Hive 表使用 serde 'com.bizo.hive.serde.csv.CSVSerde' 在 Impala 中查询上表时,我收到错误 SerDe not found。
我在 /usr/lib/impala/lib 文件夹中添加了 CSV Serde JAR 文件。
后来在 Impala 文档中研究了 Impala 不支持自定义 SERDE。在这种情况下,我该如何克服这个问题,以便我的带引号的 CSV 数据得到处理。我想使用 CSV Serde,因为它在值中使用逗号,这是一个合法的字段值。
非常感谢