这是我的第一篇文章,我是编程和 R 的新手。
我正在尝试创建一个新列来标记或标记单独列中顺序重复的值。
df <- c(2,2,2,2,3,4,3,4,3,4,2,3,7,7,7))
使用复制函数返回以下内容:
data.frame(值 = df,标志 = 重复(df))
value flag
1 2 FALSE
2 2 TRUE
3 2 TRUE
4 2 TRUE
5 3 FALSE
6 4 FALSE
7 3 TRUE
8 4 TRUE
9 3 TRUE
10 4 TRUE
11 2 TRUE
12 3 TRUE
13 7 FALSE
14 7 TRUE
15 7 TRUE
我想要的是:
value flag
1 2 TRUE
2 2 TRUE
3 2 TRUE
4 2 TRUE
5 3 FALSE
6 4 FALSE
7 3 FALSE
8 4 FALSE
9 3 FALSE
10 4 FALSE
11 2 FALSE
12 3 FALSE
13 7 TRUE
14 7 TRUE
15 7 TRUE
我的数据集有超过 200 万个观测值,因此理想情况下该解决方案将是有效的。
谢谢你,约翰