5

我是 R 的新手,我只是在学习这些apply功能以及它们是如何工作的。我只是想从lm几年内按产品颜色和品牌对变量 x 的拟合中提取系数。

我知道我可以创建一个 for 循环并按型号年份对数据进行子集化并对其进行拟合,但我认为是时候开始使用更多内置函数了,所以我希望能够使用 by 函数或其中一个 apply 来完成功能。这就是我的想法。

#some made up data

x<-rnorm(50,13400,1200)
color<-sample(factor(c("Red","Black","Blue","Green","White")),50,replace=T)
year<-sample(factor(2006:2012),50,replace=T)
brand<-sample(factor(c("A","B","C","D")),50,replace=T)

d<-data.frame(x,color,year,brand)

#now I want to fit the model lm(x~color+brand) for each year level
#this is what I was thinking...

tmp<-with(d,by(x,year,function(y) lm(x~color,data=y)))
sapply(tmp,coef)

eval 中的错误(predvars,data,env):数字“envir”arg 长度不为 1

我是根据我进入时 R 给出的例子help(by)

4

3 回答 3

6

试试这个:

tmp <- by(d, year, function(d.subset) lm(x~color, data=d.subset))
于 2012-07-01T18:30:57.867 回答
5

除了使用基本的 R 函数(这是了解它们如何工作的好主意)之外,还值得看看谁以前可能在这方面工作过。将线性模型拟合到数据集的每个子集是很多事情,事实证明人们已经专门为此构建了一些方便的工具。

尝试查看包lme4和 function lmList。从 中的示例?lmList

(fm1 <- lmList(Reaction ~ Days | Subject, sleepstudy))

Reaction ~ Days它分别为每个拟合线性模型Subject。这很方便,因为提取器方法直接作用于fm1

> coef(fm1)
    (Intercept)      Days
308    244.1927 21.764702
309    205.0549  2.261785
310    203.4842  6.114899
330    289.6851  3.008073
331    285.7390  5.266019
332    264.2516  9.566768
333    275.0191  9.142045
334    240.1629 12.253141
335    263.0347 -2.881034
337    290.1041 19.025974
349    215.1118 13.493933
350    225.8346 19.504017
351    261.1470  6.433498
352    276.3721 13.566549
369    254.9681 11.348109
370    210.4491 18.056151
371    253.6360  9.188445
372    267.0448 11.298073

(行号是 的 id 值Subjects)请参阅帮助文件?lmList以查看还有哪些其他方法可用于置信区间、绘图等。

于 2012-07-01T18:37:08.317 回答
2

这在更现代的软件包中要容易得多,例如data.table

library(data.table)
setDT(d)
d[ , .(reg = list(lm(x ~ color))), by = year]
#    year  reg
# 1: 2012 <lm>
# 2: 2006 <lm>
# 3: 2011 <lm>
# 4: 2008 <lm>
# 5: 2007 <lm>
# 6: 2010 <lm>
# 7: 2009 <lm>

reglm对象;请注意,我们需要换行lmlist(.)以免data.table混淆普通列表(注意is.list(lm(x ~ color, data = d))TRUE.

于 2017-12-13T08:50:19.900 回答