2

我有 1 分钟的盘中价格数据,其中缺少数据点。因此,我想填补它们。

我通读了以下帖子中的建议并尝试了类似的程序: R:在时间序列中填充缺失的日期?

就我而言,缺失的数据点是第一笔交易,即 09:31:00。

> head(s)
                    AMR.Open AMR.High AMR.Low AMR.Close AMR.Volume AMR.WAP AMR.hasGaps AMR.Count
2010-09-10 09:32:00     6.08     6.10    6.07      6.10        298   6.087           0        39
2010-09-10 09:33:00     6.10     6.14    6.10      6.14        274   6.122           0        70
2010-09-10 09:34:00     6.14     6.15    6.13      6.13        472   6.133           0        96
2010-09-10 09:35:00     6.13     6.14    6.13      6.13        291   6.133           0        68
2010-09-10 09:36:00     6.13     6.13    6.11      6.11        548   6.123           0        97
2010-09-10 09:37:00     6.11     6.11    6.11      6.11         67   6.110           0        26

> na.locf(s, xout=seq(as.POSIXct(head(index(s), 1) - 60), as.POSIXct(tail(index(s), 1)), by="1 min")) -> ss

> head(ss)
                    AMR.Open AMR.High AMR.Low AMR.Close AMR.Volume AMR.WAP AMR.hasGaps AMR.Count
2010-09-10 09:32:00     6.08     6.10    6.07      6.10        298   6.087           0        39
2010-09-10 09:33:00     6.10     6.14    6.10      6.14        274   6.122           0        70
2010-09-10 09:34:00     6.14     6.15    6.13      6.13        472   6.133           0        96
2010-09-10 09:35:00     6.13     6.14    6.13      6.13        291   6.133           0        68
2010-09-10 09:36:00     6.13     6.13    6.11      6.11        548   6.123           0        97
2010-09-10 09:37:00     6.11     6.11    6.11      6.11         67   6.110           0        26

正如您在上面看到的,返回的对象没有按需要填充。

您可以在下面看到我正确指定了开始和结束时间。

> as.POSIXct(head(index(s), 1) - 60)
[1] "2010-09-10 09:31:00 EDT"

> as.POSIXct(tail(index(s), 1))
[1] "2010-09-10 16:00:00 EDT"
> 

这可能是因为日期范围指定了时区,而原始 POSIX 索引没有?我试图通过指定 tz="" 来删除 tz,但这并没有删除它。话虽如此,时区可能只是一个红鲱鱼。

如果有人有兴趣测试,我将数据保存为 rda(二进制)格式:

http://www.speedyshare.com/files/28576853/test.rda

感谢帮助。

4

1 回答 1

2

na.locf对数据而不是索引进行操作。如果要向NA数据添加一行,则需要为 to 制作一个合适的 xtsrbind对象s

miss <- xts(matrix(1*NA,1,NCOL(s)), first(index(s))-60)
s <- rbind(miss,s)
s <- na.locf(s, fromLast=TRUE)
于 2011-05-29T01:27:48.177 回答