我正在使用sparklyr
图书馆。
我有一个变量,wtd
我将其复制到 spark:
copy_to(sc,wtd)
colnames(wtd) <- c("a","b","c","d","e","f","g")
然后我想做一个计算并将其存储在 spark 中,而不是在我的 R 环境中。
当我尝试:
sdf_register(wtd %>% group_by(c,b) %>% filter(row_number()==1) %>%count(d), "wtd2")
UseMethod(“sdf_register”)中的错误:没有适用于“sdf_register”的方法应用于类“c('tbl_df','tbl','data.frame')”的对象
该命令wtd2 = wtd %>% group_by(c,b) %>% filter(row_number()==1) %>%count(d)
可以正常工作,但这会将其存储在我的环境中,而不是火花中。