对于几个 dfms,我将它们转换为 stm/lda/topicmodels 格式没有问题。但是,如果我在转换之前使用 dfm_tfidf() 对 dfms 进行加权,则会收到以下错误:
convert.dfm(users_dfm, to = "stm") 中的错误:无法将非计数 dfm 转换为主题模型格式
知道为什么会这样吗?我已经为术语和文档频率尝试了不同的加权方案(尝试使加权 dfm 成为“计数”dfm),但我不断收到错误消息。
所以,这有效:
users_dfm <- dfm(users_tokens)
users_stm <- convert(users_dfm, to = "stm")
但这不会:
users_dfm <- dfm(users_tokens)
weighted_dfm <- dfm_tfidf(users_dfm)
users_stm <- convert(weighted_dfm, to = "stm")
谢谢!