0

需要将表模式(使用 describe\list 列)提取到 .txt 或 .csv 文件中,然后使用 python 将这些文件转换为 .avsc(avro 模式)文件。

示例.txt:

COLUMN_NAME |TYPE_NAME|DEC&|NUM&|COLUM&|COLUMN_DEF|CHAR_OCTE&|IS_NULL&

AIRLINE |CHAR |NULL|NULL|2 |NULL |4 |NO AIRLINE_FULL |VARCHAR |NULL|NULL|24 |NULL |48 |YES

需要将sample.txt转换成sample.avsc

4

1 回答 1

0
  1. 将 CSV 读入 python 字典
  2. 获取其他字典的标题部分(header_dict)
  3. 创建空 dict(final_dict) 并附加类型、命名空间 reletad 事物并将行从 header_dict 传递到这个 final_dict。
  4. 将 final_dict 转储到文件中,这将是您的 avsc
于 2019-03-28T06:23:32.147 回答