我正在尝试使用tm包创建一个TermDocumentMatrix,但似乎遇到了困难。
输入:
trainDF<-as.matrix(list("I'm going home", "trying to fix this", "when I go home"))
目标 - 从输入创建 TDM:(并非下面列出的所有控制参数)
control <- list(
weight= weightTfIdf,
removeNumbers=TRUE,
removeStopwords=TRUE,
removePunctuation=TRUE,
stemWords=TRUE,
maxWordLength=maxWordL,
bounds=list(local=c(minDocFreq, maxDocFreq))
)
tdm<- TermDocumentMatrix(Corpus(DataframeSource(trainDF)),control = control)
我得到的错误:
Warning message:
In is.na(x) : is.na() applied to non-(list or vector) of type 'NULL'
并且 tdm 对象是空的。有任何想法吗?