我正在处理来自 Kaggle 的数据集,这是数据集的某些部分
所以我想删除“日期”列中的时间,它只会显示“15-05-13”而不是“15-05-13 17:00”。我想知道如何编码?
我认为应该是这样的:
train$Dates <- sub("15-05-13 17:00", "15-05-13", train$Dates)
但是这样一来,我会永远走下去,因为数据集是巨大的......
我将日期列一分为二,使用“”作为分隔符
train <- data.frame(date = c("15-05-13 17:00", "15-05-13 16:00", "15-05-13 15:00"))
train
# date
# 1 15-05-13 17:00
# 2 15-05-13 16:00
# 3 15-05-13 15:00
train <- data.frame(date=c("15-05-13 17:00", "15-05-13 16:00", "15-05-13 15:00"))
within(train, date<-data.frame(do.call('rbind', strsplit(as.character(date), ' ', fixed=TRUE))))
train
# date.X1 date.X2
# 1 15-05-13 17:00
# 2 15-05-13 16:00
# 3 15-05-13 15:00
并删除了时间列
train$time <- NULL
现在如果你打电话给火车:
# date.X1
# 1 15-05-13
# 2 15-05-13
# 3 15-05-13
温迪,你只需要:
train$date <- format(as.Date(train$date,'%y-%m-%d'),'%y-%m-%d’)
> train
date
1 15-05-13
2 15-05-13
3 15-05-13