我正在为许多研究论文做循环。在这里,我想从阅读文档中提取内容。
我怎样才能使 R 只读取到最后一行,那里有很多点,并指示为结束行?如下图所示:
[数字] [字母][点][数字]
如果没有多个点,则停止并指示为结束线。
例如,我有以下代码,但它不适用于其他文档,因为有时会有不同的结尾。
if(((nrow(pdf[pdf$text == "References ." & pdf$element_id == '2',]) == 1) & !(exists("endline"))) == 1){
endline <- pdf$line_id[pdf$text == "References ." & pdf$element_id == '2']
}
R 读取整个文档并仅识别到最后一个有许多点的位置。