假设我有两个带有一些公共变量的数据框x
:
df1 <- data.frame(
x=c(1, 2, 3, 4),
y=c("a", "b", "c", "d")
)
df2 <- data.frame(
x=c(1, 1, 2, 2, 3, 4, 5),
z=c("A", "B", "C", "D", "E", "F", "G")
)
我们可以假设我们要合并的变量的每个条目在;x
中只出现一次。df1
但是,它可能会在 中出现任意次数df2
。
我想合并df2
'into' df1
,同时保留df1
. 是否有合并这两个数据帧的快速方法,以便合并后的输出为以下形式(例如):
df_merged <- data.frame(
x=c(1, 2, 3, 4),
y=c("a", "b", "c", "d"),
z=c("A B", "C D", "E", "F")
)
本质上,我想df_merged
成为原始的组合df1
,除了df2
强制匹配格式的任何变量df1
。的各种咒语merge
会将新行附加到合并的输出中,我想避免这种情况。
我们可以假设我们要合并的变量的每个条目 ,x
恰好出现一次。
速度也是一个优先事项,因为我将合并相当大的数据帧。