我希望有人知道 dplyr 中的一种简单/高效的方法,我可以在其中定义一个指示变量,如果在 Date X 上,IP 地址存在 >50 次,则取值为 1。数据是两列,一列是 IP 地址,另一列是相关的访问日期。
例如,我希望机器人列中的以下输出(假设日期/IP 组合 >=3)。
IP Date Robot
1 A 1
1 A 1
1 A 1
1 B 0
2 B 0
2 C 1
2 C 1
2 C 1
3 C 0
3 D 0
4 A 0
谢谢!