我的 pandas 数据框中有一个列表列以及 int、string 等列。我能够转换字符串、日期、整数和时间戳列。我想知道如何将 array() 应用于列表列。
fields = [
pa.field('id', pa.int64()),
pa.field('secondaryid', pa.int64()),
pa.field('date', pa.timestamp('ms')),
pa.field('emails', pa.array())
]
my_schema = pa.schema(fields)
table = pa.Table.from_pandas(sample_df, schema=my_schema, preserve_index=False)
它要求为数组传递一个对象。我想知道如何将字符串类型数组的模式应用于“电子邮件”列,请记住我将表格写成镶木地板格式,因此空数组将导致 SegFault。最好的方法是什么?