我正在处理非常大的大学生数据集,其中日期的形式为
%d/%m/%y
我需要锻炼年龄。
我的数据看起来像这样,因为它是从数据库中提取的:
data <- data.table(DOB=c("12/12/01", "8/05/80", "2/11/99"),
started =c("5/10/10", "4/01/12", "27/08/11"))
问题是计算年龄时没有指定全年。
我尝试将年份更改为数字:
data$DOB<-as.Date(data$DOB, "%d/%m/%y")
data$start<-as.Date(data$start, "%d/%m/%y")
data$DOB<-as.numeric(format(data$DOB,"%Y"))
data$start<-as.numeric(format(data$start,"%Y"))
data$age<-data$start-data$dob
显然这不起作用,因为我需要添加 20 和 19。
有没有办法我可以使用 gsub 在所有 dob 小于或等于 15 的前面放置一个“20”,而在所有 dob 大于 15 的前面放置一个“19”。
我认为我的数据集中没有 85 岁的人。