0

我有格式的样本记录

9220216686,2011-05-05 22:48:26,28,C,PRE_HOST10_JINGLE_PP-PREF_WELCOME_PP-PREF_PROMO_PP|M001:6|M487:8|M312:3|M183:3|M093,CD,49,

我想基于分隔符,|分隔符将数据加载到配置单元中。我搜索并想出了MultiDelimitSerDe。但我面临的问题是某些记录将在 M 起始字段中具有最小列,例如

9220216686,2011-05-05 22:48:26,28,C,PRE_HOST10_JINGLE_PP-PREF_WELCOME_PP-PREF_PROMO_PP|M001:6|M487:4,CD,49,

该记录仅包含两个 M 起始字段。我知道我们可以使用 map-reduce 作业来解决这个问题。但是有什么方法可以有效地将数据加载到单个查询的配置单元中?

4

0 回答 0