6

如何清除通过 rpy 创建的对象(及其占用的内存)?

import rpy2.robjects as r
a = r.r('a = matrix(NA, 2000000, 50)')
del a    #if I do this, there is no change in the amount of memory used
r.r('rm(list=(ls(all=TRUE)))') # Same here, the objects disappear, but the memory is still used

不幸的是,在我的应用程序中,内存使用量会增加,直到没有足够的内存然后崩溃......来自 rpy2文档

对象本身仍然可用,并且在从 Python 中删除 foo 之前不受 R 的垃圾收集的保护

但即使这样做:

import rpy2.robjects as r
a = r.r('a = matrix(NA, 2000000, 50)')
r.r.rm('a')
del a
r.r.gc()

不释放使用的内存...

编辑:rpy2 2.0,Win XP,R 2.12.0

4

1 回答 1

6

rpy 文档中有一段提示您在删除或覆盖大对象时可能需要经常运行 Python 垃圾收集器:

R 对象存在于 R 内存空间中,Python 不知道它们的大小,因此,当涉及到大对象时,Python 似乎并不总是足够频繁地进行垃圾收集。当大对象在循环中被覆盖时,这有时会导致内存使用量暂时增加,尽管达到系统的内存限制似乎会触发垃圾收集,但可能希望显式触发垃圾收集。

我能够通过gc.collect()在创建矩阵后立即运行并在删除它并运行 R 的内部gc()函数后再次运行来强制 rpy2 释放该大矩阵。在睡眠循环中运行它——用于top观察内存使用量的增加/减少。

在 Ubuntu 10.0.4 上的 Python 2.6 下运行,python-rpy 版本 2.0.8 链接到 R 版本 2.10.1。希望这可以帮助您取得一些进展:

import gc
import time

import rpy2.robjects as R

for i in range(5):
    print 'pass %d' % i
    R.r('a = matrix(NA, 1000000, 50)')
    gc.collect()
    R.r('rm(a)')
    R.r('gc()')
    gc.collect()

    print 'sleeping..'
    time.sleep(5)
于 2011-03-05T05:16:31.517 回答