0

我有一个字节数组,它是镶木地板文件的内容。

如何提取镶木地板文件的架构,但 1)不写入新文件然后再次读取它,2)不使用 Spark?

public class main {

    public static void main(String[] args) {
        byte[] parquet_content = ...
        
        /** Extract the schema of this parquet data below */
        ...
        ... 
    }
}

输入(csv格式的输入parquet文件的示例内容):

id, name, major 
1, Lisa, Physics

预期输出(我想得到类似下面的东西):

id -> int
name -> string
major -> string
4

0 回答 0