schema = StructType([
StructField("title", StringType(), False),
StructField("stringdataA", StringType(), False),
# StructField("list", ArrayType( StructType([
# StructField("A", IntegerType() , False),
# StructField("B", StringType() , False),
# StructField("C", TimestampType(), False)
# ]))),
StructField("stringdataB", StringType(), False)])
@pandas_udf(schema, PandasUDFType.GROUPED_MAP)
def make_data(x):
~~ make data fitted in shcema
groupedList = df.groupby("groupkey").apply(make_data)
'make_data' 函数将生成适合我定义的模式的数据,但是当我在模式中添加 list(map()) 结构字段时。它给了我一个如下所示的错误。那真的不支持架构结构吗?
有什么方法可以获取我可以处理的 list(map()) 结构数据吗?
NotImplementedError:使用分组映射 Pandas UDF 的 returnType 无效:StructType(List(StructField(title,StringType,false),StructField(stringdataA,StringType,false),StructField(list,ArrayType(StructType(List(StructField(A,IntegerType,false) ,StructField(B,StringType,false),StructField(C,TimestampType,false))),true),true),StructField(stringdataB,StringType,false))) 不支持