1

我正在尝试创建一个我想要运行文本挖掘分析的所有转录的列表。

我正在使用 qdap 使用以下代码读取转录:

read.transcript(transcript1_filename,col.names = c("Person","Dialogue"),skip = 5)

这会生成一个包含两列的数据帧,一列标识说话者,另一列标识对话字符串。

我有很多转录,所以想创建一个列表以进行进一步分析。

我试过这样使用 lapply :

transcript_files = list.files("~/Transcripts",full.names = TRUE)
my_list = list()
my_list= lapply(transcript_files,read.transcript(),col.names = c("Person","Dialogue"),skip = 5)

但这会产生以下错误:

Error in regexpr("\\.([[:alnum:]]+)$", x) : argument "file" is missing, with no default

我也尝试了一个for循环:

for(i in length(transcript_files)){
my_list[[i]] = read.transcript(transcript_files[i],col.names = c("Person","Dialogue"),skip = 5)
}

但由于某种原因,这只读取最后一个文件,列表中的所有其他条目都是 NULL。

不知道这里出了什么问题。

4

0 回答 0