我有以下数据框:
location <- "https://www.mofa.go.jp/announce/info/conferment/pdfs/2013_sp.pdf"
out <- tabulizer::extract_tables(location)
final <- do.call(rbind, out)
final <- as.data.frame(final) %>%
janitor::row_to_names(row_number = 2) %>%
janitor::clean_names()
不幸的是,由于tabulizer::extract_table
(参见此线程)的提取问题,数据框不干净。
一个数据点跨越多行,然后是空行(屏幕截图中的第 20 和 26 行):
如果它们之后有一个空行(或者如果之后没有行,如数据框的最后一行),是否可以自动将多行合并为一行?
换言之,第 13-19 行应形成单行,第 21-25 行也应作为单行。列是正确的。
我将不胜感激您的帮助!