0

我正在尝试在 R 中使用 readtext 导入超过 13,000 个 .rtf 文件,但在下面收到一条错误消息。

uk <- readtext("/Users/path/*.rtf",
docvarsfrom = "filenames",
docvarnames = c("country", "year", "id"),
dvsep = "_")
Error in chartr(.cptable[[cpname]]$before, .cptable[[cpname]]$after, out[parsed$toconv]) : 
  invalid input '' in 'utf8towcs'

当我将相同的代码应用于仅包含 1,000 个文件的测试文件夹时,代码似乎运行良好。但是,当我尝试将文件夹中的文件数增加到 5,000 个时,返回了相同的错误代码。我尝试导入的文件名格式为uk_1992_1.rtfuk_2010_3568.rtf,如下面的链接所示。

文件名 (1,000)

我的问题是:

  1. 这只是尝试一次导入太多文件的问题吗?

  2. 有没有办法修复此代码以允许一次导入更多文件?

  3. 如果无法修复代码,是否有解决方法?

抱歉,如果该问题已在其他地方提出,我试图寻找类似的问题,但没有找到任何问题。我可以(并且尝试过)将文件拆分为几个较小的文件夹,这似乎工作正常,但是有更多的国家/地区需要以相同的方式处理和分析相同数量的文件。蒂亚!

4

0 回答 0