我有一个向量:
test <-c(1,1,0,2,2,3,4,1,1,0)
test
# [1] 1 1 0 2 2 3 4 1 1 0
我想构造一个分组变量来指示值何时发生变化:
# [1] 1 1 2 3 3 4 5 6 6 7
做这个的最好方式是什么?
使用游程编码 ( rle
),seq_along
并且rep
r <- rle(test)
changes <- rep(seq_along(r$lengths), r$lengths)
changes
## [1] 1 1 2 3 3 4 5 6 6 7
替代选项,诚然仅适用于数字数据。
test <-c(1,1,0,2,2,3,4,1,1,0)
cumsum(c(1L, diff(test) != 0))
# [1] 1 1 2 3 3 4 5 6 6 7
以及适用于任何数据类型的复杂变体:
head(cumsum(c(TRUE, c(tail(test, -1), NA) != test)), -1)
# [1] 1 1 2 3 3 4 5 6 6 7