我有一个字节数组,它是镶木地板文件的内容。
如何提取镶木地板文件的架构,但 1)不写入新文件然后再次读取它,2)不使用 Spark?
public class main {
public static void main(String[] args) {
byte[] parquet_content = ...
/** Extract the schema of this parquet data below */
...
...
}
}
输入(csv格式的输入parquet文件的示例内容):
id, name, major
1, Lisa, Physics
预期输出(我想得到类似下面的东西):
id -> int
name -> string
major -> string