0

我正在使用 quanteda,一个用于管理和分析文本的 R 包。我在使用它的一个核心功能时遇到了麻烦:“dfm”,它用于构建文档频率矩阵。

运行函数

# Install packages
packages <- function(x){
  x <- as.character(match.call()[[2]])
  if (!require(x,character.only=TRUE)){
    install.packages(pkgs=x,repos="http://cran.r-project.org")
    require(x,character.only=TRUE)
  }
}

packages("XML")
packages("textcat")
packages("tm")
packages("RTextTools")
packages("stringi")
packages("proxy")
packages("cluster")
packages("topicmodels")
packages("dplyr")
packages("plyr")
packages("stringr")
packages("quanteda")
packages("ggplot2")
packages("RWeka")

# Build textfile using 2nd field text for analysis
txt <- textfile("myfile.csv",textField = 2)

# Build object of class corpus from txt
MyCorpus <- corpus(txt)

# Construct a document-frequency matrix
myDfm <- dfm(MyCorpus)

返回的代码和错误

Creating a dfm from a corpus ...
   ... indexing 55 documents
   ... tokenizing texts, found 1,730 total tokens
   ... cleaning the tokens, 17 removed entirely
   ... summing tokens by document
   ... indexing 710 feature types
   ... building sparse matrix
Error in validObject(.Object) : 
  invalid class “dfmSparse” object: superclass "dCsparseMatrix" not defined in the environment of the object's class

如您所见,该函数正在运行,但在“构建稀疏矩阵”之后就卡住了。我不明白这个错误或如何解决它。有什么建议吗?

4

1 回答 1

1

我找到了简单的解决方案:从 R 版本 3.1.2 更改为 3.2.2

于 2016-06-08T13:16:15.180 回答