在花了很多时间开发正确的语料库(例如停用词、tf-idf)之后,我dtm
在tm
包中创建了一个并运行了我的主题模型。
然后,我继续将主题与一些感兴趣的文档级协变量进行比较,只是为了了解这stm
允许您使用感兴趣的文档级协变量来估计模型。
我已成功将 my 转换dtm
为dfm
inquanteda
并希望dfm
在转换为 a 之前将我的协变量添加到stm
.
我有一个data.frame
与我感兴趣的协变量,它们row.id
与dfm
.
我正在寻找一种解决方案,将 的协变量data.frame
与dfm
.
我努力了:
docvars
并无济于事metadoc
。quanteda
例如,
docvars(dfm, docnames(dfm)) <- df$covariate
任何帮助将不胜感激!