我有两个数据框——一个很大(超过 200 万行),一个较小(大约 300,000 行)。较小的数据帧是较大数据帧的子集。唯一的区别是较大的有一个附加属性,我需要将其添加到较小的属性中。
具体来说,大数据帧的属性是(日期、时间、地址、标志),小数据帧的属性是(日期、时间、地址)。我需要以某种方式将正确的相应标志值放入每行的较小数据框中。“合并”数据帧的最终大小应该与我的较小数据帧相同,从大数据帧中丢弃未使用的行。
实现这一目标的最佳方法是什么?
更新:我用以下方法测试了合并功能:
new<-merge(data12, data2, by.x = c("Date", "Time", "Address"),
by.y=c("Date", "Time", "Address"))
和
new<-merge(data12, data2, by = c("Date", "Time", "Address"))
两者都返回具有正确数量的属性以及以下警告消息的空数据框(新):
Warning message:In `[<-.factor`(`*tmp*`, ri, value = c(15640, 15843, 15843, 15161, : invalid factor level, NAs generated