汤米是最好的答案。这太大了,无法发表评论,因此将其添加为答案...
这就是您自己查看副本的方式(DF
正如 joran 评论的那样,整个副本):
> DF = data.frame(a=1:3,b=4:6)
> tracemem(DF)
[1] "<0x0000000003104800"
> for (i in 1:3) {DF$b[i] <- i; .Internal(inspect(DF))}
tracemem[0000000003104800 -> 000000000396EAD8]:
tracemem[000000000396EAD8 -> 000000000396E4F0]: $<-.data.frame $<-
tracemem[000000000396E4F0 -> 000000000399CDC8]: $<-.data.frame $<-
@000000000399CDC8 19 VECSXP g0c2 [OBJ,NAM(2),TR,ATT] (len=2, tl=0)
@000000000399CD90 13 INTSXP g0c2 [] (len=3, tl=0) 1,2,3
@000000000399CCE8 13 INTSXP g0c2 [] (len=3, tl=0) 1,5,6
ATTRIB: # .. snip ..
tracemem[000000000399CDC8 -> 000000000399CC40]:
tracemem[000000000399CC40 -> 000000000399CAB8]: $<-.data.frame $<-
tracemem[000000000399CAB8 -> 000000000399C9A0]: $<-.data.frame $<-
@000000000399C9A0 19 VECSXP g0c2 [OBJ,NAM(2),TR,ATT] (len=2, tl=0)
@000000000399C968 13 INTSXP g0c2 [] (len=3, tl=0) 1,2,3
@000000000399C888 13 INTSXP g0c2 [] (len=3, tl=0) 1,2,6
ATTRIB: # .. snip ..
tracemem[000000000399C9A0 -> 000000000399C7E0]:
tracemem[000000000399C7E0 -> 000000000399C700]: $<-.data.frame $<-
tracemem[000000000399C700 -> 00000000039C78D8]: $<-.data.frame $<-
@00000000039C78D8 19 VECSXP g0c2 [OBJ,NAM(2),TR,ATT] (len=2, tl=0)
@00000000039C78A0 13 INTSXP g0c2 [] (len=3, tl=0) 1,2,3
@0000000003E07890 13 INTSXP g0c2 [] (len=3, tl=0) 1,2,3
ATTRIB: # .. snip ..
> DF
a b
1 1 1
2 2 2
3 3 3
这些行中的每一tracemem[]
行都对应于整个对象的副本。您也可以看到a
列向量的十六进制地址每次都在变化,尽管它没有被分配修改b
。
AFAIK,在不自己放入 C 代码的情况下,在 R 中(当前)修改 a 项而data.frame
根本没有任何内存副本的唯一方法是:=
操作符和set()
函数,两者都在 package 中data.table
。在 Stack Overflow 上有17 个关于通过引用分配的问题。:=
但在这种情况下,Tommy 的一个班轮绝对是最好的,因为您甚至根本不需要循环。