Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有一些数据以 avro 格式 v1 出现并存储在 HDFS 的分区 dt=yyyymmdd 下。 现在数据用两个版本维护,v1和v2在同一个分区下。 为两个不同版本维护一个配置单元表是否可行?
Avro 定义了一个模式演化协议
例如,如果 v2 只是简单地添加了一个具有默认值的字段,然后使用该模式更新表,它可以读取整个旧数据,因为它只会在缺少默认值的地方返回默认值。
如果您破坏了兼容性,则必须单独制作一个表,然后将两者合并以获得一致的结果集