首先,修复您的格式并使用类似的包xts
来获取正确的时间序列对象:
# Read in the data. In the future, use `dput` or something else
# so that others can read in the data in a more convenient way
temp = read.table(header=TRUE, text=" V1 V2 V3
1 20100420 915 120
2 20100420 920 150
3 20100420 925 270
4 20100420 1530 281")
# Get your date object and format it to a date/time object
date = paste0(temp[[1]], apply(temp[2], 1, function(x) sprintf("%04.f", x)))
date = strptime(date, format="%Y%m%d%H%M")
# Extract just the values
values = temp[[3]]
# Load the xts package and convert your dataset
require(xts)
xts(values, order.by=date)
# [,1]
# 2010-04-20 09:15:00 120
# 2010-04-20 09:20:00 150
# 2010-04-20 09:25:00 270
# 2010-04-20 15:30:00 281
在日期转换中:
apply(temp[2], 1, ...)
逐行查找 temp 的第二列并将数字重新格式化为四位数。
- 然后,
paste0
将所有日期时间信息组合到一个向量中。
- 最后,
strptime
将该字符向量转换为适当的日期时间对象。
更新
当然,如果你只想要一个 normal data.frame
,你也可以这样做,但我强烈建议使用类似的东西,zoo
或者xts
如果你想做实时序列分析。
这是简单的data.frame
步骤(在之前创建date
andvalues
对象之后)。
data.frame(V3 = values, row.names=date)
# V3
# 2010-04-20 09:15:00 120
# 2010-04-20 09:20:00 150
# 2010-04-20 09:25:00 270
# 2010-04-20 15:30:00 281