1

最近,parquet-format项目添加了一个 UUID 逻辑类型。具体来说,这是在镶木地板格式的修订版 2.4中添加的。我有兴趣在 Java 中使用parquet-mr库来创建一些 parquet 文件,但我似乎无法弄清楚如何在 parquet 模式中使用 UUID 逻辑类型。像这样的简单模式似乎并不像我希望的那样工作:

message SimpleSchema {
  required int32 value1;
  required fixed_len_byte_array(16) value2 ( UUID );
}

我在这个模式上尝试了很多变体,到目前为止还没有设法让它用MessageTypeParser.parseMessageType方法解析。这是 parquet-mr 库的错误还是限制?还是我只是错误地格式化了我的架构?谢谢!

4

2 回答 2

1

parquet-mr 库目前不支持 UUID 逻辑类型。在此处跟踪实现此功能的进度存在问题。

于 2020-03-25T20:03:01.367 回答
0

它最近实现了:
https
://issues.apache.org/jira/browse/PARQUET-1827 但尚未包含在正式1.11.1版本中。
请使用1.12.0-SNAPHOT来自 github 的资源来利用最新的功能:
https ://github.com/apache/parquet-mr

于 2020-12-31T21:31:03.967 回答