1

我正在使用 Rpy2 用 ggplot2 绘制数据帧。我制作了以下情节:

p = ggplot2.ggplot(iris) + \
    ggplot2.geom_point(ggplot2.aes_string(x="Sepal.Length", y="Sepal.Width")) + \
    ggplot2.facet_wrap(Formula("~Species"))
p.plot()
r["dev.off"]()  

我想用一些关于情节的统计数据来注释每个子情节。例如,我想计算每个 x/y 子图之间的相关性并将其放在图的右上角。如何才能做到这一点?理想情况下,我想将数据帧从 R 转换为 Python 对象,计算相关性,然后将它们投影到散点上。以下转换不起作用,但这就是我正在尝试的方式:

# This does not work 
#iris_df = pandas.DataFrame({"Sepal.Length": rpy2.robjects.default_ri2py(iris.rx("Sepal.Length")),
#                            "Sepal.Width": rpy2.robjects.default_ri2py(iris.rx("Sepal.Width")),
#                            "Species": rpy2.robjects.default_ri2py(iris.rx("Species"))})
# So we access iris using R to compute the correlation
x = iris_py.rx("Sepal.Length")
y = iris_py.rx("Sepal.Width")
# compute r.cor(x, y) and divide up by Species
# Assume we get a vector of length Species saying what the
# correlation is for each Species' Petal Length/Width
p = ggplot2.ggplot(iris) + \
    ggplot2.geom_point(ggplot2.aes_string(x="Sepal.Length", y="Sepal.Width")) + \
    ggplot2.facet_wrap(Formula("~Species")) + \
    # ...
    # How to project correlation?
p.plot()
r["dev.off"]()    

但是假设我实际上可以从 Python 访问 R 数据框,我该如何绘制这些相关性呢?谢谢。

4

2 回答 2

1

解决方案是为每个绘制的样本创建一个带有标签的数据框。数据框的列应与数据框的相应列名与原始数据匹配。然后可以用以下方式绘制:

p += ggplot2.geom_text(data=labels_df, mapping=ggplot2.aes_string(x="1", y="1", mapping="labels"))

其中labels_df是包含标签的数据框,是要绘制的标签labels的列名。在这种情况下,将是每个子图中标签的坐标位置。labels_df(1,1)

于 2013-02-18T04:40:37.067 回答
0

我发现@user248237dfsf 的答案对我不起作用。ggplot 在我正在绘制的数据框和我用于标签的数据框之间感到困惑。

相反,我使用 ggplot2_env = robjects.baseenv'as.environment'

class GBaseObject(robjects.RObject):
  @classmethod
  def new(*args, **kwargs):
    args_list = list(args)
    cls = args_list.pop(0)
    res = cls(cls._constructor(*args_list, **kwargs))
    return res

class Annotate(GBaseObject):
  _constructor = ggplot2_env['annotate']
annotate = Annotate.new

现在,我有了一些像标准注释一样的东西。

annotate(geom = "text", x = 1, y = 1, label = "MPC")

一个小评论:我不知道这是否适用于刻面。

于 2016-06-28T19:51:48.290 回答