我正在尝试使用众所周知的 Reuters-21578 数据集做一些工作,并且在将 sgm 文件加载到我的语料库时遇到了一些麻烦。
现在我正在使用命令
require(tm)
reut21578 <- system.file("reuters21578", package = "tm")
reuters <-Corpus(DirSource(reut21578),
readerControl = list(reader = readReut21578XML))
试图将所有文件包含到我的语料库中,但这给了我以下错误:
Error in DirSource(reut21578) : empty directory
知道我哪里可能出错了吗?