csv
格式的样本数据。保存在文件中broken_posix.csv
Date
3/10/2012 23:00
3/11/2012 0:00
3/11/2012 1:00
3/11/2012 2:00
3/11/2012 3:00
3/11/2012 4:00
3/11/2012 5:00
3/11/2012 6:00
3/11/2012 7:00
3/11/2012 8:00
3/11/2012 9:00
3/11/2012 10:00
3/11/2012 11:00
3/11/2012 12:00
3/11/2012 13:00
3/11/2012 14:00
3/11/2012 15:00
3/11/2012 16:00
3/11/2012 17:00
3/11/2012 18:00
3/11/2012 19:00
3/11/2012 20:00
3/11/2012 21:00
3/11/2012 22:00
3/11/2012 23:00
3/12/2012 0:00
3/12/2012 1:00
3/12/2012 2:00
3/12/2012 3:00
3/12/2012 4:00
3/12/2012 5:00
3/12/2012 6:00
3/12/2012 7:00
3/12/2012 8:00
3/12/2012 9:00
3/12/2012 10:00
3/12/2012 11:00
所以我有这个文件broken_posix.csv
。我可以很好地阅读文件
a_var <- read.csv("broken_posix.csv")
然后我可以将其转换为posix
使用
a_var_posixct = as.POSIXct(strptime( as.character( a_var$Date) , '%m/%d/%Y %H:%M'))
或与
a_var_posixlt = strptime(as.character( a_var$Date) , '%m/%d/%Y %H:%M')
但是现在出现了问题,因为当我使用 posixct 时,我每年都会在我的字符串中获得 4 个 NA 值。当我使用时,posixlt
我得到一个NA
值March 11,2012 at 2 (daylight savings time)
当你跑的时候你会明白我的意思
which(is.na(a_var_posixct))
which(is.na(a_var_posixlt))
a_var_posixct[4]
a_var_posixlt[4]
每当您应用操作时,第四个值始终是一个NA
值,即使它显然是 posixlt 的日期值。
我尝试省略该值只是为了弄乱 posix 字符串的其余部分。我尝试将 posix 字符串设置为自身,试图清除 NA 标志,但没有效果。我什至尝试将其设置为字符值,只是为了丢失小时和分钟格式。
我认为这种情况发生是因为夏令时。处理起来非常令人沮丧,因为当我尝试在日期运行其他函数时,我必须尽量避免 NA 值,因为我无法更改它们。我可以按天聚合数据,或者只使用日期对象,但这似乎不是正确的方法。