56

我搜索了这个问题并找到了一些答案,但它们似乎都不起作用。这是我在 python 中用来运行我的 R 脚本的脚本。

import subprocess
retcode = subprocess.call("/usr/bin/Rscript --vanilla -e 'source(\"/pathto/MyrScript.r\")'", shell=True)

我得到这个错误:

Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
  no lines available in input
Calls: source ... withVisible -> eval -> eval -> read.csv -> read.table
Execution halted

这是我的 R 脚本的内容(很简单!)

data = read.csv('features.csv')
data1 = read.csv("BagofWords.csv")
merged = merge(data,data1)
write.table(merged, "merged.csv",quote=FALSE,sep=",",row.names=FALSE)
for (i in 1:length(merged$fileName))
{
        fileConn<-file(paste("output/",toString(merged$fileName[i]),".txt",sep=""))
        writeLines((toString(merged$BagofWord[i])),fileConn)
        close(fileConn)
}

当我source('MyrScript.r')在 r 命令行中使用时,r 脚本工作正常。此外,当我尝试使用我在命令行中传递给subprocess.call函数(即/usr/bin/Rscript --vanilla -e 'source("/pathto/MyrScript.r")')的确切命令时,它可以找到,我真的不明白问题出在哪里。

4

6 回答 6

65

我不会太相信通话中的来源Rscript因为您可能不完全了解您在哪里运行不同的嵌套R 会话。该过程可能会因为简单的事情而失败,例如您的工作目录不是您想的那样。

Rscript让您直接运行脚本(查看man Rscript您是否使用 Linux)。

然后你可以直接做:

subprocess.call ("/usr/bin/Rscript --vanilla /pathto/MyrScript.r", shell=True)

Rscript或更好地将命令及其参数解析为列表

subprocess.call (["/usr/bin/Rscript", "--vanilla", "/pathto/MyrScript.r"])

此外,为了使事情更容易,您可以创建一个R 可执行文件。为此,您只需在脚本的第一行添加它:

#! /usr/bin/Rscript

并赋予其执行权。有关详细信息,请参见此处

然后,您可以像调用任何其他 shell 命令或脚本一样进行 python 调用:

subprocess.call ("/pathto/MyrScript.r")
于 2016-06-29T10:24:27.683 回答
27

我认为 RPy2 值得研究,这是 R-bloggers.com 上的一个很酷的演示文稿,可以帮助您入门:

http://www.r-bloggers.com/accessing-r-from-python-using-rpy2/

从本质上讲,它允许您使用 R 对象访问 R 库,这些对象提供高级和低级接口。

以下是最新版本的文档:https ://rpy2.github.io/doc/latest/html/

我喜欢将 Python 用户指向 Anaconda,如果您使用包管理器 ,conda来安装rpy2,它还将确保您安装 R。

$ conda install rpy2

这是基于文档介绍的小插曲:

>>> from rpy2 import robjects
>>> pi = robjects.r['pi']
>>> pi
R object with classes: ('numeric',) mapped to:
<FloatVector - Python:0x7fde1c00a088 / R:0x562b8fbbe118>
[3.141593]

>>> from rpy2.robjects.packages import importr
>>> base = importr('base')
>>> utils = importr('utils')

>>> import rpy2.robjects.packages as rpackages
>>> utils = rpackages.importr('utils')
>>> packnames = ('ggplot2', 'hexbin')
>>> from rpy2.robjects.vectors import StrVector
>>> names_to_install = [x for x in packnames if not rpackages.isinstalled(x)]
>>> if len(names_to_install) > 0:
...     utils.install_packages(StrVector(names_to_install))

并运行一个 R 片段:

>>> robjects.r('''
...         # create a function `f`
...         f <- function(r, verbose=FALSE) {
...             if (verbose) {
...                 cat("I am calling f().\n")
...             }
...             2 * pi * r
...         }
...         # call the function `f` with argument value 3
...         f(3)
...         ''')
R object with classes: ('numeric',) mapped to:
<FloatVector - Python:0x7fde1be0d8c8 / R:0x562b91196b18>
[18.849556]

还有一个小型的独立图形演示:

from rpy2.robjects.packages import importr
graphics = importr('graphics')
grdevices = importr('grDevices')
base = importr('base')
stats = importr('stats')

import array

x = array.array('i', range(10))
y = stats.rnorm(10)

grdevices.X11()

graphics.par(mfrow = array.array('i', [2,2]))
graphics.plot(x, y, ylab = "foo/bar", col = "red")

kwargs = {'ylab':"foo/bar", 'type':"b", 'col':"blue", 'log':"x"}
graphics.plot(x, y, **kwargs)


m = base.matrix(stats.rnorm(100), ncol=5)
pca = stats.princomp(m)
graphics.plot(pca, main="Eigen values")
stats.biplot(pca, main="biplot")
于 2013-11-10T20:13:50.840 回答
1

我不建议对 python 和 R 之间存在许多差异使用系统调用,尤其是在传递数据时。

有许多标准库可以从 Python 调用 R 以供选择,请参阅此答案

于 2013-11-10T19:59:56.273 回答
1

如果您只想运行一个脚本,那么您system("shell command")可以sys使用import sys. 如果你有一个有用的输出,你可以" > outputfilename"在你的 shell 命令结束时打印结果。

例如:

import sys

system("ls -al > output.txt")
于 2016-06-30T18:59:03.120 回答
1

尝试在 R 脚本的开头添加一行:

setwd("path-to-working-directory")

除了,将路径替换为包含文件features.csvBagofWords.csv.

我认为您遇到的问题是因为当您从 R 运行此脚本时,您的工作目录已经是正确的路径,但是当您从 python 运行脚本时,它默认为其他地方的工作目录(可能是用户目录的顶部)。

通过在 R 脚本的开头添加额外的行,您可以显式设置工作目录,并且在这些文件中读取的代码将起作用。或者,您可以将文件名替换read.csv()为这些文件的完整文件路径。

@dmontaner 在他的回答中提出了这种可能性:

该过程可能会因为简单的事情而失败,例如您的工作目录不是您想的那样。

于 2016-07-04T00:32:13.160 回答
0

以下代码应该可以解决:

import rpy2.robjects as robjects
robjects.r.source("/pathto/MyrScript.r", encoding="utf-8")
于 2021-11-24T01:54:40.640 回答