当我尝试将 stemCompletion 应用于语料库时,此函数会生成 NA 值..
这是我的代码:
my.corpus <- tm_map(my.corpus, removePunctuation)
my.corpus <- tm_map(my.corpus, removeWords, stopwords("english"))
(其中一个结果是:[[2584]] 分区计划)
下一步是填充语料库,因此:
my.corpus <- tm_map(my.corpus, stemDocument, language="english")
my.corpus <- tm_map(my.corpus, stemCompletion, dictionary=my.corpus_copy, type="first")
但结果是这样的
[[2584]] 北美工厂
下一步应该是创建一个包含事务的关联矩阵,然后是先验规则,但如果我继续尝试获取规则,inspect(rules) 函数会给我这个错误:
> inspect(rules)
Errore in UseMethod("inspect", x) :
no applicable method for 'inspect' applied to an object of class "c('rules','associations')"
有什么问题?我想NA值不能正确生成关联矩阵,然后是好的规则..这是问题吗?如果是这样,我该如何解决?
这是问题的摘要:
this is an abstract:
my.words = c("β cell","zoning policy regional index brazil","zoning plan","zolpidem adult","zizyphus spinosa hu")
my.corpus = Corpus(VectorSource(my.words))
my.corpus_copy = my.corpus
my.corpus = tm_map(my.corpus, removePunctuation)
my.corpus = tm_map(my.corpus, removeWords, c("the", stopwords("english")))
my.corpus = tm_map(my.corpus, stemDocument, language="english")
my.corpus <- tm_map(my.corpus, stemCompletion, dictionary=my.corpus_copy, type="first")
inspect(my.corpus)