5

下面是示例数据(大约 8000 行数据)。如何用平滑样条拟合其余数据的值替换所有 NA?

Date            Max Min Rain    RHM RHE
4/24/1981   35.9    24.7    0.0 71  37
4/25/1981   36.8    22.8    0.0 62  40
4/26/1981   36.0    22.6    0.0 47  37
4/27/1981   35.1    24.2    0.0 51  39
4/28/1981   35.4    23.8    0.0 61  47
4/29/1981   35.4    25.1    0.0 67  43
4/30/1981   37.4    24.8    0.0 72  34
5/1/1981      NA      NA     NA NA  NA
5/2/1981    39.0    25.3     NA NA  55
5/3/1981    35.9    23.0    0.0 68  66
5/4/1981    28.4    22.4    0.7 70  30
5/5/1981    35.5    24.6    0.0 47  31
5/6/1981    37.4    25.5    0.0 51  31
4

2 回答 2

6

要检查的一件事可能是包中的na.spline功能zoo。它似乎是为此目的而定制的。

缺失值 (NA) 分别由通过近似样条插值的线性插值或通过样条的三次样条插值代替。

于 2013-09-10T06:03:54.273 回答
2

我正在使用一些简化的数据来回答这个查询。拿这个数据集:

dat <- structure(list(x = c(1.6, 1.6, 4.4, 4.5, 6.1, 6.7, 7.3, 8, 9.5, 
9.5, 10.7), y = c(2.2, 4.5, 1.6, 4.3, NA, NA, 4.8, 7.3, 8.7, 6.3, 12.3)),
.Names = c("x", "y"), row.names = c(NA, -11L), class = "data.frame")

使用 绘制时如下所示plot(dat,type="o",pch=19)

在此处输入图像描述

现在将平滑样条拟合到没有NA值的数据

smoo <- with(dat[!is.na(dat$y),],smooth.spline(x,y))

然后预测 的y值,当前x在哪里yNA

result <- with(dat,predict(smoo,x[is.na(y)]))
points(result,pch=19,col="red")

在此处输入图像描述

要将值填充回原始数据,您可以执行以下操作:

dat[is.na(dat$y),] <- result
于 2013-09-09T10:35:47.503 回答