1

我正在处理来自 Kaggle 的数据集,这是数据集的某些部分

在此处输入图像描述

所以我想删除“日期”列中的时间,它只会显示“15-05-13”而不是“15-05-13 17:00”。我想知道如何编码?

我认为应该是这样的:

train$Dates <- sub("15-05-13 17:00", "15-05-13", train$Dates)

但是这样一来,我会永远走下去,因为数据集是巨大的......

4

2 回答 2

2

我将日期列一分为二,使用“”作为分隔符

train <- data.frame(date = c("15-05-13 17:00", "15-05-13 16:00", "15-05-13 15:00"))
train
#             date
# 1 15-05-13 17:00
# 2 15-05-13 16:00
# 3 15-05-13 15:00

train <- data.frame(date=c("15-05-13 17:00", "15-05-13 16:00", "15-05-13 15:00"))
within(train, date<-data.frame(do.call('rbind', strsplit(as.character(date), ' ', fixed=TRUE))))
train
#    date.X1 date.X2
# 1 15-05-13   17:00
# 2 15-05-13   16:00
# 3 15-05-13   15:00

并删除了时间列

train$time <- NULL

现在如果你打电话给火车:

#    date.X1 
# 1 15-05-13 
# 2 15-05-13 
# 3 15-05-13 
于 2015-07-18T02:38:19.647 回答
1

温迪,你只需要:

train$date <- format(as.Date(train$date,'%y-%m-%d'),'%y-%m-%d’)

> train
      date
1 15-05-13
2 15-05-13
3 15-05-13
于 2015-07-18T07:31:26.553 回答