我有一个镶木地板文件,其中有一列“FIXED_LEN_BYTE_ARRAY / UUID”,当我将它提供给 parquet-mr 库时,我得到了这个异常:
异常 - 由以下原因引起:org.apache.parquet.io.ParquetDecodingException:请求的架构与文件架构不兼容。不兼容的类型:必需的二进制文件
身份 (STRING) != 必需的 fixed_len_byte_array(16) 身份 (UUID)
在 org.apache.parquet.io.ColumnIOFactory$ColumnIOCreatorVisitor.incompatibleSchema(ColumnIOFactory.java:101)
在 org.apache.parquet.io.ColumnIOFactory$ColumnIOCreatorVisitor.visit(ColumnIOFactory.java:93)
在 org.apache.parquet.schema .PrimitiveType.accept(PrimitiveType.java:602)
at org.apache.parquet.io.ColumnIOFactory$ColumnIOCreatorVisitor.visitChildren(ColumnIOFactory.java:83)
at org.apache.parquet.io.ColumnIOFactory$ColumnIOCreatorVisitor.visit(ColumnIOFactory.java :57) 在 org.apache.parquet.io.ColumnIOFactory.getColumnIO(ColumnIOFactory.java:162) 在 org.apache.parquet.hadoop 的 org.apache.parquet.schema.MessageType.accept(MessageType.java:55)。 InternalParquetRecordReader.checkRead(InternalParquetRecordReader.java:135) ***
顺便提一句,
- 我正在使用最新的 parquet-mr 库,即 1.12.0
- 当我将相同的文件提供给 parquet cpp 库时,它能够对其进行解码。所以,我只想知道,parquet-mr 库 wrt UUID 中是否存在任何已知问题?
-开发