我想这样做:在 read.table/read.csv 中为 colClasses 参数指定自定义日期格式
我在 csv 中的 DateTime 字符串的格式为“2010-08-18T09:50:00.000+02:00”。最后一部分是与 GMT 的区别。
所以我调整了上面问题中给出的解决方案:
> setClass("myDateTime")
[1] "myDateTime"
> setAs("character","myDateTime", function(from) as.POSIXlt(from, tz=paste("GMT", substr(from,24,24), substr(from,26,26), sep=""), format="%Y-%m-%dT%H:%M:%S") )
到目前为止一切正常:
> as("2010-08-18T09:50:00.000+02:00", "myDateTime")
[1] "2010-08-18 09:50:00 GMT+2"
但是当尝试从 csv 文件中读取数据时,会出现错误:
> text <- "num;source;date1;date2
+ 1000000001;test;1985-11-17T00:00:00.000+01:00;1985-11-17T00:00:00.000+01:00
+ 1000000047;test;1971-03-07T00:00:00.000+01:00;1985-11-17T00:00:00.000+01:00
+ 1000000128;test;1967-11-02T00:00:00.000+01:00;1985-11-17T00:00:00.000+01:00"
> tab2 <- read.table(textConnection(text), sep=";", header=T, row.names=NULL, quote="", colClasses = c("numeric","character","myDateTime","myDateTime"), na.string=c(""))
Error in strptime(x, format, tz = tz) : invalid 'tz' value
我无法找出错误来自哪里。你能帮助我吗?