0

我正在尝试为时间序列的子集创建黄土曲线。在应用黄土时,所有子集似乎都有类似的问题,所以问题可能出在我身上,df但我不知道如何解决。

数据可在此处获得:https ://dl.dropbox.com/s/zy6b5mjcu7uteof/data_all_PAR_max.csv?dl=0

这个函数是一个更大的函数的一部分,所以一些值被传递并在这里定义以帮助重现错误:

sumfile <- read.csv('https://dl.dropbox.com/s/zy6b5mjcu7uteof/data_all_PAR_max.csv')
codename = "EXEM"
descriptor = "max"
radtype = "PAR"
totYrs = c(1997:2015)
ylbl = expression("PAR " ~ (mu ~ mol ~ photons ~ m^{-2} ~ s^{-1}))
clr = "blue"

group <- melt(sumfile,  id.vars = 'date', variable.name = 'series')
setnames(group, old = c('date','series','value'), new = c('Date','Year',radtype))
group$Date <- as.Date(group$Date)
# group <- na.omit(group) # uncommenting resolves error!
o <- order(group$Date)
lo <- loess(PAR ~ as.numeric(Date), span = 0.25, data=group)

plot(group$Date,group$PAR,pch=19,cex=0.1, col=clr,
     xlab ="Date",
     ylab = ylbl,
    main = paste('Loess curve for', descriptor, radtype, 'from', min(totYrs), 'to',
              max(totYrs), '\nmeasured at', codename, 'met',sep=' '))
lines(group$Date[o], lo$fitted[o], col='red', lwd=1)

替换linesforpoints可以更好地了解错误

points(group$Date[o], lo$fitted[o], col='red', lwd=1)

情节应该是这样的:

黄土误差图

幻象点似乎是数据集中 NA 的伪影。

我创建了一个循环来检查发现更多错误的每一年。

for (i in totYrs) {
  tryCatch({         
    yval <- paste(radtype, i, descriptor,sep='_')

    sumfile$date <- as.Date(sumfile$date)
    lo_ <- eval(parse(text = paste("loess(", yval, "~ as.numeric(date),
                                 span = 0.25, data=sumfile)")))
    oo <- order(sumfile$date)
    plot(sumfile$date, eval(parse(text = paste("sumfile$",yval))),
         pch=19,cex=0.1, col=clr,
         xlab ="Date",
         ylab = ylbl,
         main = paste('Loess curve for', descriptor, radtype, 'measured at\n',
                      codename, 'met during', i, '/', i+1, 'field season',sep=' '))
    lines(sumfile$date[oo], lo_$fitted[oo], col='red', lwd=1)  
  }, error=function(e){print("One or more years was not plotted because there was no data")})
}

该循环为每年创建一个图,并说明曲线平滑如何在某些年份起作用,但在其他年份却不起作用。

设置loess(y ~ x, na.action=na.exclude)似乎对最终结果没有任何影响。添加group <- na.omit(group)到融化df之前可以loess()解决该数据框的错误,但在检查个别年份时问题似乎仍然存在。这是一个例子:

sumfile$date <- as.Date(sumfile$date)
no_na <- na.omit(subset(sumfile, select=c(date,PAR_2013_max)))
lo13 <- loess(PAR_2013_max ~ as.numeric(date), span = 0.25, data=no_na)
oo <- order(sumfile$date)
plot(sumfile$date, sumfile$PAR_2013_max)
lines(sumfile$date[oo], lo13$fitted[oo], col='red', lwd=1)

非常感谢任何帮助确定绘制年度曲线的解决方案。

4

1 回答 1

0

我认为您对那些“幻象”点的来源是正确的。您应该可以省略任何 NA 值,这是使用 ggplot2 的示例:

plot <- ggplot( data = group, aes( x = Date, y = PAR ) ) +
    geom_point( na.rm = TRUE ) +
    geom_smooth( method = "loess", span = 0.2, na.rm = TRUE )
plot

这给了我一个很好的曲线。请注意,“span”变量决定了 loess 函数的平滑程度,因此请根据需要调整它,或者将其排除在外以接受默认平滑。

这也适用于每年单独:

plot <- ggplot( data = sumfile, aes( x = as.Date( date ), y = PAR_2013_max ) ) +
    geom_point( na.rm = TRUE ) +
    geom_smooth( method = "loess", span = 0.2, na.rm = TRUE )
plot
于 2016-05-26T03:58:38.923 回答