我想展平从 HTML 表中提取的列表。下面给出了一个最小的工作示例。该示例取决于stringr
R 中的包。第一个示例展示了所需的行为。
years <- c("2005-", "2003-")
unlist(str_extract_all(years,"[[:digit:]]{4}"))
[1] "2005" "2003"
当我尝试匹配一系列其他数字中的最后 4 位数字时,下面的示例会产生不希望的结果。
years1 <- c("2005-", "2003-", "1984-1992, 1996-")
unlist(str_extract_all(years1,"[[:digit:]]{4}$"))
character(0)
据我了解文档,我应该$
在模式的末尾包含,以便在字符串的末尾请求匹配。我更愿意匹配第二个示例中的数字“2005”、“2003”和“1996”。