'u' 是一个包含 ID = 1, 2, 3 .. 和 time= "2010-01-01", "2012-04-06", .. ID 和 time 的 DataFrame 具有字符串类型。我将时间类型转换为“日期”
u$time <- cast(u[[2]], "Date")
我现在想在你的第一次。
first <- first(u$time)
我现在通过在第一次添加 150 天来创建一个新时间
cluster<- first+150
我现在想做一个子集。我想要一个新的“你”,时间从前 150 天开始。
ucluster <- filter(u, u$time < cluster)
但这不能在 sparkR 中运行。我收到此消息“returnstatus==0 is not TRUE”。