我有一个大型数据集,其中一列中有许多重复值,但其余列缺少我想填写的值。
id <- rep(1:3, 3:1)
name <- c("sam", "sam", "", "mike", "", "tom")
df<- data.frame(id, name)
id name
1 sam
1 sam
1
2 mike
2
3 tom
由于原始数据的性质,id 和 name 字段都是因素(约 2000 个唯一 ID 值,超过 45000 行)。我想根据以下内容填写缺失值
我试过unique()
and duplicated()
,但更换有困难。如果愿意,我想使用基本包。
谢谢!