0

我是 R 和因子分析的新手。我试图做的案例是在 twitter 上进行文本挖掘,并使用事实函数将术语简化为因子。我设法检索推文,将其放入 csv 中,并从中制作一个术语文档矩阵。

这是我试图做的具体代码:

tweetsTestRaw<-read.csv(filename,header=T)
tweetsTest<-clean_text(tweetsTestRaw$text) #my custom text cleaning function
tweetsTest.corpus <- Corpus(VectorSource(as.vector(tweetsTest)))
tweetsTest.matrix <- t(TermDocumentMatrix(tweetsTest.corpus,control = list(wordLengths=c(4,Inf))));
d = as.matrix(tweetsTest.matrix)
d_stan = as.data.frame(scale(d))
res1a = factanal(d_stan, factors = 2, rotation = "varimax", na.action = na.omit) #error

这是我的术语文档矩阵的一小部分:

我的术语文档矩阵

执行 factanal() 函数后,它总是给出错误:

Error in solve.default(cv) : 
Lapack routine dgesv: system is exactly singular: U[6,6] = 0

我通过互联网搜索有关此错误的信息。没有人谈论在推文上使用因子分析。有些人谈论不同情况下的数据错误,但没有人为我提供我应该做什么的解决方案。我真的不懂因子分析。因此,如果有人建议我对数据做一些事情,我希望你能提供如何做到这一点的代码。

4

0 回答 0