我已阅读以下文本文件并遇到以下问题,
文件名:QnA.txt
问:你叫什么名字?
答案:XXX
问:请告诉我你的地址?
答案:XXX, xxxx-ssss, 00000
问题:告诉我其他细节
答案:当然,......
txt <- "directory path"
QuesAnsFiles <- Corpus(DirSource(txt, encoding = "UTF-8"),readerControl = list(language = "lat"))
我已经在语料库中阅读了这个文本文件,现在我必须在该文件中进行一些文本挖掘,为此我必须将每个语料库文件创建到一个数据帧中,例如:
df <- data.frame(Question='',Answer='')
我怎样才能阅读每个语料库并转换成我想要的数据框......?
更多理解说明:
df$Question会显示所有问题,相应地df$Answer会显示对应问题的答案
请提出解决此问题的适当方法,稍后我将重点关注速度...