我正在为一项关于鳟鱼生长的观察性研究分析数据。所以数据框中有很多 NA。此外,不同的处理具有不同数量的观察值。所以我认为这可以称为不平衡设计?
Year Site FishID Size Cover AGE L1
2010 LT1 10_LT1 _ 11 Large Heavy 2 5.88
2010 LT3 10_LT3 _ 14 Large Heavy 2 5.228571429
2010 SO4 10_SO4 _ 8 Small Open 0 NA
2010 SO5 10_SO5 _ 22 Small Open 0 NA
2011 LT1 11_LT1 _ 14 Large Heavy 1 6.44
2011 LT1 11_LT1 _ 15 Large Heavy 1 6.25
2011 LT1 11_LT1 _ 16 Large Heavy 1 6.421052632
2011 LT1 11_LT1 _ 18 Large Heavy 1 7.74
2011 SO5 11_SO5 _ 6 Small Open 1 7.7625
2011 SO5 11_SO5 _ 8 Small Open 1 6.914285714
2011 SO5 11_SO5 _ 13 Small Open 1 6.5
2011 SO5 11_SO5 _ 16 Small Open 1 7.2
2011 ST1 11_ST1 _ 21 Small Heavy 0 NA
2011 ST2 11_ST2 _ 10 Small Heavy 0 NA
2011 ST2 11_ST2 _ 5 Small Heavy 0 NA
2011 ST3 11_ST3 _ 20 Small Heavy 0 NA
2011 ST4 11_ST4 _ 5 Small Heavy 0 NA
2011 ST1 11_ST1 _ 9 Small Heavy 1 7.521428571
2011 ST1 11_ST1 _ 17 Small Heavy 1 8.169230769
2011 ST1 11_ST1 _ 20 Small Heavy 1 7.03125
我的固定效果是流大小:2 级流覆盖:2 级,年份:2 级和年龄:3 级。
我还随机选择了一堆站点来检查流大小和流覆盖效果。所以我认为网站被归类为随机效应?
L1
是增长率的代表。
在这个阶段,我的最大模型如下所示:
m1=lme(L1~Year*Age*Size*Cover, random=~1|Site ,data=Trout_Growth,method="ML",na.action=na.exclude)
qqnorm(residuals(m1))
qqline(residuals(m1)) # Normality OK
plot(density(residuals(m1),na.rm=T)) ***## heteroscedasticity present (lme should handle this??) ##***
summary(m1)
anova(m1,test=T,type="marginal") ***## marginal used because of unbalanced design?? ##***
我当然已经很好地查看了这个很棒的网站,但我仍然不确定包含随机因素网站的正确符号。(lme 和 lmer 似乎使用不同的符号。这是正确的吗?)
我想我在问这是否是完善我的模型的正确起点。我开始真正喜欢 R,但没有经常对 R 代码竖起大拇指,我很想回到舒适的基于 Windows 的统计软件。
任何意见或建议将不胜感激。
迪尔姆