0

我有一个数据文件,其中给出的日期没有年份。

01/05   Fellowship enters Moria
01/09   Fellowship reaches Lorien
01/17   Passing of Gandalf
02/07   Fellowship leaves Lorien
02/17   Death of Boromir

我试着这样读

lotr <- read_tsv(lotr_file,
                 skip = 9,
                 col_names = c("date", "event"),
                 col_types = cols(
                    date = col_date(format = "%m/%d"),
                    event = col_character()))

但它接缝的是,readr 的日期解析器无法解析没有年份的日期。另一方面,lubridate 可以处理这样的日期:

> parse_date_time("12-15", "%m-%d")
[1] "0000-12-15 UTC"

有什么方法可以让读者阅读这些日期或使用 lubridate?

如果 readr 无法处理这样的“日期”或一年中的某一天,我将按以下方式使用 dplyr:

lotr <- read_tsv(lotr_file,
                 skip = 9,
                 n_max = 37,
                 col_names = c("day_of_year", "event"),
                 col_types = cols(
                   day_of_year = col_character(),
                   event = col_character())) %>% 
   mutate(date = parse_date(paste0("2016/",day_of_year))) %>% 
   select(date, event)
4

1 回答 1

2

正如 Rich 在评论中指出的那样,没有年份的“日期”是无效的,因为您需要年份、月份和日期。

类似的问题以前出现过,答案是只添加缺失类型值,无论是一天到一个月和一年,还是这里是一年到一天和一个月。

参见例如

R> vals <- c("01/05", "01/09", "01/17", "02/07", "02/17")  # values
R> yval <- paste0("2000/", vals)  # prefix a year 
R> anytime::anydate(yval)    # needs no format
[1] "2000-01-05" "2000-01-09" "2000-01-17" "2000-02-07" "2000-02-17"
R> 

如果你有它们,你可以格式化,或计算差异,或者......两个例子:

R> diff(anytime::anydate(yval))
Time differences in days
[1]  4  8 21 10
R> format(anytime::anydate(yval), "%d-%b")
[1] "05-Jan" "09-Jan" "17-Jan" "07-Feb" "17-Feb"
R> 
于 2016-12-15T21:45:09.070 回答