我是 R 新手,试图在 sparkR 中重写 R 代码。名为costTbl的 data.table 上的操作之一(它有 5 个其他列)是
costTbl[,cost:=na.locf(cost,na.rm=FALSE),by=product_id]
costTbl[,cost:=na.locf(cost,na.rm=FALSE, fromLast=TRUE),by=product_id]
我无法在 sparkR 中找到等效的操作。我认为可以通过对 product_id 上的 df 进行分组并执行此操作来使用 gapply。但我无法使代码工作。
gapply是正确的方法吗?还有其他方法可以实现这一目标吗?