14

我以前从未使用过 rpy2,但我只是想知道是否可以使用它将 python 对象(pandas DataFrame)保存在 R 可读文件中。我无法在这些环境之间移动对象,主要是因为我使用的是 Windows,并且数据源是 Excel 文件。是的,这种单元格包含文本,包括引号、换行符以及 CSV 无法充分处理的所有内容。

我通常依赖 XLConnectJars,但它似乎坏了

Installing package(s) into ‘C:/Program Files/R/library’
(as ‘lib’ is unspecified)
trying URL 'http://cran.csiro.au/bin/windows/contrib/2.15/XLConnectJars_0.2-4.zip'
Content type 'application/zip' length 16538311 bytes (15.8 Mb)
opened URL
downloaded 15.3 Mb

Warning in install.packages :
  downloaded length 16011264 != reported length 16538311

pandas 可以正确读取,但我需要使用 R 中的信息。

4

3 回答 3

8

以下是您写入/读取.RData文件的方式rpy2(因为已弃用已接受的解决方案并且未显示如何保存到.RData文件):

import rpy2
from rpy2 import robjects
from rpy2.robjects import pandas2ri
pandas2ri.activate()

# read .RData file as a pandas dataframe
def load_rdata_file(filename):
    r_data = robjects.r['get'](robjects.r['load'](filename))
    df = pandas2ri.ri2py(r_data)
    return df

# write pandas dataframe to an .RData file
def save_rdata_file(df, filename):
    r_data = pandas2ri.py2ri(df)
    robjects.r.assign("my_df", r_data)
    robjects.r("save(my_df, file='{}')".format(filename))
于 2017-09-29T01:26:39.563 回答
7

您可以使用 rpy2 来执行此操作。一旦你在 pandas 中获得数据,你必须将它传输到 R。这个链接提供了 Python Pandas 和 R data.frames 之间的实验接口。从网站复制的代码示例:

from pandas import DataFrame
import pandas.rpy.common as com

df = DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C':[7,8,9]},
                index=["one", "two", "three"])
r_dataframe = com.convert_to_r_dataframe(df)

print type(r_dataframe)
 <class 'rpy2.robjects.vectors.DataFrame'>

print r_dataframe
      A B C
one   1 4 7
two   2 5 8
three 3 6 9
于 2013-02-26T06:32:51.553 回答
2

使用 3.3.2 的最新版本rpy2,我无法获得其他答案。现在看来,转换的工作方式有点不同。

import pandas
p_df = pandas.DataFrame(data={'col1': [1, 2], 'col2': [3, 4]})

以下代码会将上述 pandas 数据帧转换为 R 数据帧,并将 R 数据帧保存为 R.rds文件。

from rpy2 import robjects
from rpy2.robjects import pandas2ri
from rpy2.robjects.conversion import localconverter

# Convert pandas dataframe to R dataframe
with localconverter(robjects.default_converter + pandas2ri.converter):
    r_df = robjects.conversion.py2rpy(p_df)

# Save R dataframe as .rds file
r_file = "file.rds"
robjects.r.assign("my_df_tosave", r_df)
robjects.r(f"saveRDS(my_df_tosave, file='{r_file}')")

以下代码将加载.rds文件并将其转换回 pandas 数据帧。

# Load as R dataframe from .rds file
r_file = "file.rds"
robjects.r(f"df_to_load <- readRDS('{r_file}')") 
r_df = robjects.r["df_to_load"]

# Convert R dataframe to pandas dataframe
with localconverter(robjects.default_converter + pandas2ri.converter):
    p_df = robjects.conversion.rpy2py(r_df)
于 2020-07-17T05:21:56.910 回答