我有问卷数据,参与者以多种格式输入了他们的出生日期:
ID <- c(101,102,103,104,105,106,107)
dob <- c("20/04/2001","29/10/2000","September 1 2012","15/11/00","20.01.1999","April 20th 1999", "04/08/01")
df <- data.frame(ID, dob)
在进行任何分析之前,我需要能够在数据格式不正确(即 dd/mm/yr)时对数据进行子集化,然后依次手动更正每个单元格。
我尝试使用:
df$dob <- strptime(dob, "%d/%m/%Y")
...以突出显示我的哪些日期格式正确,但我只是得到输入错误日期的 NA,如果我想随后更改它们(使用 ID 作为参考),这将无济于事。
有没有人有任何可以帮助我的想法?