我正在尝试创建一个我想要运行文本挖掘分析的所有转录的列表。
我正在使用 qdap 使用以下代码读取转录:
read.transcript(transcript1_filename,col.names = c("Person","Dialogue"),skip = 5)
这会生成一个包含两列的数据帧,一列标识说话者,另一列标识对话字符串。
我有很多转录,所以想创建一个列表以进行进一步分析。
我试过这样使用 lapply :
transcript_files = list.files("~/Transcripts",full.names = TRUE)
my_list = list()
my_list= lapply(transcript_files,read.transcript(),col.names = c("Person","Dialogue"),skip = 5)
但这会产生以下错误:
Error in regexpr("\\.([[:alnum:]]+)$", x) : argument "file" is missing, with no default
我也尝试了一个for循环:
for(i in length(transcript_files)){
my_list[[i]] = read.transcript(transcript_files[i],col.names = c("Person","Dialogue"),skip = 5)
}
但由于某种原因,这只读取最后一个文件,列表中的所有其他条目都是 NULL。
不知道这里出了什么问题。