1

这将是一个很长的问题。所以,请原谅我

我有以下场景,我想最好给出一个伪代码来更好地解释事情

一个 python 文件说test.py

def test(i):
    from rpy2.robjects import r
    r.source('r_file.R')
    r.call_function(with some arguments)

    #Some Operations
    del r

文件:r_file.R

rm(list=ls(all=TRUE))

#some global variables
#some reference class

#creating an object of reference class
call_function = function(some arguments)
{
    Do some processing
    call few methods on a reference class

    call some more methods and do some operations

    rm(list=ls(all=TRUE))
    gc()

    return(0)

}

在 python 中对函数 test 的调用发生在 'i' 的某些值上,即函数被调用为 i 的某些值,它总是大于 1,即函数从main被多次调用。因此,我们不止一次地获取 R 文件。每次调用 python 函数时,我都想要一个新的 R 解释器。因此,每次调用该函数时我都会导入 r 并删除 rpy2 对象。

在 r 函数“call_function”中,我调用了一些方法,这些方法又创建了引用类对象。

在 R 代码中,我在代码开头以及函数 some_function 退出时使用 rm。

鉴于这种背景,我现在面临的问题是 rm 没有删除代码中的任何引用类,我不断收到这样的警告

In .removePreviousCoerce(class1, class2, where, prevIs) :
  methods currently exist for coercing from "Rev_R5" to "envRefClass"; they will be replaced

在这里,Rev_R5 是一个参考类。我不希望这种情况发生,有没有办法使用 rm 删除与引用类相关的所有方法对象?

4

1 回答 1

4

从 R 的全局环境中删除所有对象并不意味着您回到了新启动的 R 进程(类和方法定义可能会保留,正如您所发现的那样)。

可以考虑R 函数,例如removeClass()removeMethod()removeGeneric过程相对较快)。

由于无法终止和重新启动嵌入式 R(限制来自 R,而不是 rpy2),因此您必须启动和停止嵌入 R 的 Python 进程。

一种方法是使用 Python 包multiprocessing(包含在 Python 的标准库中)。一个额外的好处是这些过程可以并行运行。

以Doug Hellmann 的优秀教程为基础的简单示例:

import multiprocessing

def R_worker(i):
    """worker function"""

    print('Worker %i started' % i)
    from rpy2.robjects import r
    r.source('r_file.R')
    r.call_function(with some arguments)

    #Some Operations
    del r
    return

if __name__ == '__main__':
    jobs = []
    for i in range(5):
        p = multiprocessing.Process(target = R_worker, args=(i,))
        jobs.append(p)
        p.start()
于 2013-02-12T01:50:14.747 回答