我正在尝试为时间序列的子集创建黄土曲线。在应用黄土时,所有子集似乎都有类似的问题,所以问题可能出在我身上,df
但我不知道如何解决。
数据可在此处获得:https ://dl.dropbox.com/s/zy6b5mjcu7uteof/data_all_PAR_max.csv?dl=0
这个函数是一个更大的函数的一部分,所以一些值被传递并在这里定义以帮助重现错误:
sumfile <- read.csv('https://dl.dropbox.com/s/zy6b5mjcu7uteof/data_all_PAR_max.csv')
codename = "EXEM"
descriptor = "max"
radtype = "PAR"
totYrs = c(1997:2015)
ylbl = expression("PAR " ~ (mu ~ mol ~ photons ~ m^{-2} ~ s^{-1}))
clr = "blue"
group <- melt(sumfile, id.vars = 'date', variable.name = 'series')
setnames(group, old = c('date','series','value'), new = c('Date','Year',radtype))
group$Date <- as.Date(group$Date)
# group <- na.omit(group) # uncommenting resolves error!
o <- order(group$Date)
lo <- loess(PAR ~ as.numeric(Date), span = 0.25, data=group)
plot(group$Date,group$PAR,pch=19,cex=0.1, col=clr,
xlab ="Date",
ylab = ylbl,
main = paste('Loess curve for', descriptor, radtype, 'from', min(totYrs), 'to',
max(totYrs), '\nmeasured at', codename, 'met',sep=' '))
lines(group$Date[o], lo$fitted[o], col='red', lwd=1)
替换lines
forpoints
可以更好地了解错误
points(group$Date[o], lo$fitted[o], col='red', lwd=1)
情节应该是这样的:
幻象点似乎是数据集中 NA 的伪影。
我创建了一个循环来检查发现更多错误的每一年。
for (i in totYrs) {
tryCatch({
yval <- paste(radtype, i, descriptor,sep='_')
sumfile$date <- as.Date(sumfile$date)
lo_ <- eval(parse(text = paste("loess(", yval, "~ as.numeric(date),
span = 0.25, data=sumfile)")))
oo <- order(sumfile$date)
plot(sumfile$date, eval(parse(text = paste("sumfile$",yval))),
pch=19,cex=0.1, col=clr,
xlab ="Date",
ylab = ylbl,
main = paste('Loess curve for', descriptor, radtype, 'measured at\n',
codename, 'met during', i, '/', i+1, 'field season',sep=' '))
lines(sumfile$date[oo], lo_$fitted[oo], col='red', lwd=1)
}, error=function(e){print("One or more years was not plotted because there was no data")})
}
该循环为每年创建一个图,并说明曲线平滑如何在某些年份起作用,但在其他年份却不起作用。
设置loess(y ~ x, na.action=na.exclude)
似乎对最终结果没有任何影响。添加group <- na.omit(group)
到融化df
之前可以loess()
解决该数据框的错误,但在检查个别年份时问题似乎仍然存在。这是一个例子:
sumfile$date <- as.Date(sumfile$date)
no_na <- na.omit(subset(sumfile, select=c(date,PAR_2013_max)))
lo13 <- loess(PAR_2013_max ~ as.numeric(date), span = 0.25, data=no_na)
oo <- order(sumfile$date)
plot(sumfile$date, sumfile$PAR_2013_max)
lines(sumfile$date[oo], lo13$fitted[oo], col='red', lwd=1)
非常感谢任何帮助确定绘制年度曲线的解决方案。