4

我有一个线性和非线性模型列表,这些模型来自不同的数据集,测量相同的两个变量xy我想使用stat_smooth. 这是为了能够轻松地比较数据集之间xy跨数据集的关系形状。

我试图找出最有效的方法来做到这一点。现在我正在考虑创建一个空的 ggplot 对象,然后使用某种循环或lapply按顺序添加到该对象,但事实证明这比我想象的要困难。当然,简单地提供模型是最简单的,ggplot但据我所知,这是不可能的。有什么想法吗?

这是一个简单的示例数据集,仅使用两个模型,一个线性模型和一个指数模型:

df1=data.frame(x=rnorm(10),y=rnorm(10))
df2=data.frame(x=rnorm(15),y=rnorm(15))

df.list=list(lm(y~x,df1),nls(y~exp(a+b*x),start=list(a=1,b=1),df2))

还有两个单独的示例图:

ggplot(df1,aes(x,y))+stat_smooth(method=lm,se=F)
ggplot(df2,aes(x,y))+stat_smooth(method=nls,formula=y~exp(a+b*x),start=list(a=1,b=1),se=F)
4

2 回答 2

9

编辑:请注意,在发布此答案后,OP 更改了问题

将数据组合成一个单独的数据框,新列表示模型,然后用于ggplot区分模型:

df1=data.frame(x=rnorm(10),y=rnorm(10))
df2=data.frame(x=rnorm(10),y=rnorm(10))

df1$model <- "A"
df2$model <- "B"

dfc <- rbind(df1, df2)

library(ggplot2)
ggplot(dfc, aes(x, y, group=model)) + geom_point() + stat_smooth(aes(col=model))

这会产生:

在此处输入图像描述

于 2012-11-08T17:34:34.930 回答
3

我认为这里的答案是得到一个你想要运行的 X 和 Y 的共同范围,然后从那里开始。您可以使用 predict 从每个模型中拉出一条曲线,并使用 l_ply 将图层添加到 ggplot。

d

f1=data.frame(x=rnorm(10),y=rnorm(10))
df2=data.frame(x=rnorm(15),y=rnorm(15))

df.list=list(lm(y~x,df1),nls(y~exp(a+b*x),start=list(a=1,b=1),df2))


a<-ggplot()


#get the range of x you want to look at
x<-seq(min(c(df1$x, df2$x)), max(c(df1$x, df2$x)), .01)

#use l_ply to keep adding layers
l_ply(df.list, function(amod){

  #a data frame for predictors and response
  ndf <- data.frame(x=x)

  #get the response using predict - you can even get a CI here
  ndf$y <- predict(amod, ndf)

  #now add this new layer to the plot
  a<<- a+geom_line(ndf, mapping=(aes(x=x, y=y)))

} )

a

或者,如果您想要一个带有型号或其他内容的漂亮颜色键:

names(df.list) <- 1:length(df.list)
modFits <- ldply(df.list, function(amod){
  ndf <- data.frame(x=x)

  #get the response using predict - you can even get a CI here
  ndf$y <- predict(amod, ndf)

  ndf

  })


qplot(x, y, geom="line", colour=.id, data=modFits)
于 2012-11-08T21:12:24.867 回答