0

我正在通过 Kafka 流式传输增量网络日志,然后存储到 HDFS 中。我的网络日志包含部分信息,即。如果我的配置单元表架构中有 10 列,我可能通过日志仅接收 6 个字段,其值被修改。现在在更新/合并到配置单元表期间,6 个字段被新值修改,其余 4 个被 Null 替换。目前我正在为这些任务探索 Kylo/Nifi 框架。我正在 Hive 中寻找一种方法,使这 4 列保持与以前状态相同。

4

0 回答 0