我通常通过表列和可选分区进行初始化来创建模式。我知道在阿里巴巴 ODPS python SDK 中通过方法创建模式Schema.from_lists
在 LOC 和性能方面要好得多。
我经常用来创建模式的代码是:
from odps.models import Schema, Column, Partition
columns = [Column(name='num', type='bigint', comment='the column')]
partitions = [Partition(name='pt', type='string', comment='the partition')]
schema = Schema(columns=columns, partitions=partitions)
print(schema.columns)
输出:
[<column num, type bigint>, <partition pt, type string>]
如何使用Schema.from_lists
方法创建模式?