当我在 R 和 Python 中保存一个镶木地板文件(使用 pyarrow)时,我得到一个保存在元数据中的箭头模式字符串。
如何读取元数据?是 Flatbuffer 编码的数据吗?架构的定义在哪里?它未在箭头文档站点上列出。
元数据是一个键值对,看起来像这样
key: "ARROW:schema"
value: "/////5AAAAAQAAAAAAAKAAwABgAFAAgACgAAAAABAwAEAAAAyP///wQAAAABAAAAFAAAABAAGAAIAAYABwAMABAAFAAQAAAAAAABBUAAAAA4AAAAEAAAACgAAAAIAAgAAAAEAAgAAAAMAAAACAAMAAgABwA…
由于在 R 中写了这个
df = data.frame(a = factor(c(1, 2)))
arrow::write_parquet(df, "c:/scratch/abc.parquet")