4

我无法删除 xts 对象中的重复行。我有一个 R 脚本,它将下载货币的刻度财务数据并将其转换为 OHLC 格式的 xts 对象。该脚本还每 15 分钟提取一次新数据。新数据从今天的第一笔交易下载到今天最后记录的交易。以前下载的旧数据以 .Rdata 格式存储并调用。然后将新数据添加到旧数据中,并以 .Rdata 格式覆盖旧数据。

这是我的数据的示例:

                      .Open   .High    .Low  .Close   .Volume .Adjusted
2012-01-07 00:00:11 6.69683 7.01556 6.38000 6.81000  48387.58   6.81000
2012-01-08 00:00:09 6.78660 7.20000 6.73357 7.11358  57193.53   7.11358
2012-01-09 00:00:57 7.08362 7.19100 5.81000 6.32570 148406.85   6.32570
2012-01-10 00:01:01 6.32687 6.89000 6.00100 6.36000 110210.25   6.36000
2012-01-11 00:00:07 6.44904 7.13800 6.41266 6.90000  99442.07   6.90000
2012-01-12 00:01:02 6.90000 6.99700 6.33700 6.79999 140116.52   6.79999
2012-01-13 00:02:01 6.78211 6.80400 6.40000 6.41000  60228.77   6.41000
2012-01-14 00:00:23 6.42000 6.50000 6.23150 6.31894  25392.98   6.31894

现在,如果我再次运行脚本,我会将新数据添加到 xts。

                      .Open   .High    .Low  .Close   .Volume .Adjusted
2012-01-07 00:00:11 6.69683 7.01556 6.38000 6.81000  48387.58   6.81000
2012-01-08 00:00:09 6.78660 7.20000 6.73357 7.11358  57193.53   7.11358
2012-01-09 00:00:57 7.08362 7.19100 5.81000 6.32570 148406.85   6.32570
2012-01-10 00:01:01 6.32687 6.89000 6.00100 6.36000 110210.25   6.36000
2012-01-11 00:00:07 6.44904 7.13800 6.41266 6.90000  99442.07   6.90000
2012-01-12 00:01:02 6.90000 6.99700 6.33700 6.79999 140116.52   6.79999
2012-01-13 00:02:01 6.78211 6.80400 6.40000 6.41000  60228.77   6.41000
2012-01-14 00:00:23 6.42000 6.50000 6.23150 6.31894  25392.98   6.31894
2012-01-14 00:00:23 6.42000 6.75000 6.22010 6.57157  75952.01   6.57157

如您所见,最后一行与倒数第二行是同一天。我想保留最后一个日期的最后一行并删除倒数第二行。当我尝试使用以下代码删除重复的行时,它不起作用,重复的行会留在那里。

xx <- mt.xts[!duplicated(mt.xts$Index),]
xx
.Open .High .Low .Close .Volume .Adjusted

我没有得到任何结果。如何使用索引作为重复指标删除 xts 对象中的重复数据条目?

4

2 回答 2

15

不应该是index(mt.xts)而不是mt.xts$Index吗?以下似乎有效。

# Sample data
library(xts)
x <- xts( 
  1:10, 
  rep( seq.Date( Sys.Date(), by="day", length=5 ), each=2 ) 
)

# Remove rows with a duplicated timestamp
y <- x[ ! duplicated( index(x) ),  ]

# Remove rows with a duplicated timestamp, but keep the latest one
z <- x[ ! duplicated( index(x), fromLast = TRUE ),  ]
于 2012-01-14T22:31:18.617 回答
2

就我而言,

x <- x[! duplicated( index(x) ),]

没有按预期工作,因为系统以某种方式使每一行中的日期时间都是唯一的。

x <- x[! duplicated( coredata(x) ),]

如果以前的解决方案没有帮助,这可能会起作用。

于 2019-01-27T19:06:48.357 回答