1

我正在尝试创建一个脚本,它将根据标签将许多 pdf 分发到文件夹树中。我有 bibtex 格式的文件元数据(包括文件路径)。我已经尝试了多种解决方法来导入元数据,但到目前为止还无法将文件路径、年份、标题和标签放入单个数据框中。

当我尝试使用 read.bib 导入时(这似乎是最简单的解决方案),我收到以下错误:

dbase_full <- read.bib("C:/Users/WILIAM-PLAN/Desktop/My Collection 23 07.bib")

read.bib 中的错误(“C:/Users/WILIAM-PLAN/Desktop/My Collection 23 07.bib”):

lex 致命错误:

致命的 flex 扫描器内部错误——缓冲区结束丢失

我已经查找了错误,但 {bibtex} 包(lex 扫描仪等)的“幕后”部分的语言超出了我的范围。

这个错误有快速修复吗?如果没有,是否有另一种方法可以将文件元数据从 bibtex 获取到数据框中?

4

1 回答 1

1

我有同样的问题。问题是 bib 文件中的某些字段(作为抽象)行可能包含很多字符。您需要拆分和包装它们。我希望它有用

于 2013-10-17T10:39:11.820 回答