我试图在数据框中找到多年的运行(最好使用 plyr)
我想从中得到:
require(plyr)
dat<-data.frame(
name=c(rep("A", 11), rep("B", 11)),
year=c(2000:2010, 2000:2005, 2007:2011)
)
对此:
out<-data.frame(
name=c("A", "B", "B"),
range=c("2000-2010", "2000-2005", "2007-2011"))
很容易确定每个组是否有连续的年份:
ddply(dat, .(name), summarise,
continuous=(max(year)-min(year))+1==length(year))
如何将“B”组分解为两个范围?
任何想法或策略将不胜感激。
谢谢