5

我有一个向量:

test <-c(1,1,0,2,2,3,4,1,1,0)  
test  
# [1] 1 1 0 2 2 3 4 1 1 0

我想构造一个分组变量来指示值何时发生变化:

# [1] 1 1 2 3 3 4 5 6 6 7

做这个的最好方式是什么?

4

2 回答 2

7

使用游程编码 ( rle),seq_along 并且rep

r <- rle(test)

changes <- rep(seq_along(r$lengths), r$lengths)
changes
## [1] 1 1 2 3 3 4 5 6 6 7
于 2013-07-09T03:02:55.047 回答
4

替代选项,诚然仅适用于数字数据。

test <-c(1,1,0,2,2,3,4,1,1,0)  
cumsum(c(1L, diff(test) != 0))
# [1] 1 1 2 3 3 4 5 6 6 7

以及适用于任何数据类型的复杂变体:

head(cumsum(c(TRUE, c(tail(test, -1), NA) != test)), -1)
# [1] 1 1 2 3 3 4 5 6 6 7
于 2013-07-09T03:20:00.993 回答