我正在使用“readtext”包在特定目录中导入多个文本文件。
library(readtext)
DATA_DIR <- system.file("extdata/", package = "readtext")
readtext(paste0(DATA_DIR, "/txt/UDHR/*"))
我的问题是:有没有办法根据标题导入文本文件?我想导入标题包含特定单词的文件,例如,apple。
提前谢谢你的帮助。
这应该做你想要的。
# List all txt files including sub-folders
list_of_files <- list.files(path = "C:\\your_path_here\\", recursive = TRUE,
pattern = "the_run", full.names = TRUE)
library(data.table)
# Read all the files and create a FileName column to store filenames
DT <- rbindlist( sapply(list_of_files, fread, simplify = FALSE),
use.names = TRUE, idcol = "FileName" )
在这个愚蠢的例子中,我设置了一个包含 3 个子文件夹的父文件夹。在每个子文件夹中,我有 5 个文本文件:the_run1.txt、the_run2.txt、the_run3.txt、run1.txt 和 run2.txt。我正在点击父文件夹,并在所有子文件夹中查找文件名中包含“the_run”的文本文件。就是这样。我创建了这 9 个文件的列表(3 个文件夹中的 3 个文件),并循环访问此列表以将所有内容加载到单个数据表中。