2

有人知道是否有办法使用 R 包将新文本数据分类为主题mallet

这个包的一般例程是:

mallet.instances <- mallet.import(as.character(data$id), 
                                 as.character(data$text), 
                                 "Documents/Projects/tm/stopwords.txt")

topic.model <- MalletLDA(num.topics=10)
topic.model$loadDocuments(mallet.instances)
topic.model$setAlphaOptimization(20, 100) # optimise parameters after every 20 iterations which will be preceeded by 100 burnin
topic.model$train(1000) # train the model
topic.model$maximize(10) # pick the best topic for each token

但是我找不到任何方法来使用预先训练的模型对新数据进行分类。替代方法是使用该topicmodels软件包或通过命令行运行Mallet 。这两个选项都是合理的(尽管我必须说我倾向于使用 Mallet 获得更令人信服的结果),但是如果我已经使用 R 包训练了一个模型mallet并且我不想更改主题,找到一种方法来使用包对数据进行分类mallet会很有帮助。

4

0 回答 0