我想gapply
根据https://spark.apache.org/docs/latest/sparkr.html#gapply使用
问题是我要返回一个包含 2 个数据框的列表。
返回(列表(df1,df2))
在这种情况下如何声明输出模式?
我想gapply
根据https://spark.apache.org/docs/latest/sparkr.html#gapply使用
问题是我要返回一个包含 2 个数据框的列表。
返回(列表(df1,df2))
在这种情况下如何声明输出模式?
您不能使用返回任意列表的函数。根据gapply
文档(强调我的):
函数 func 将一个键 - 分组列和一个数据框 - 一个本地 R 作为参数
data.frame
。func 的输出是本地的R data.frame
。
您可以通过将每个都视为与 something 等效data.frame
的单个类型来使其工作,但前提是两个输出具有相同的模式。Row
struct<col1:array<typeofcol1>, col2:array<typeofcol2>, ..., coln:array<typeofcoln>>
data.frames