在花了很多时间开发正确的语料库(例如停用词、tf-idf)之后,我dtm在tm包中创建了一个并运行了我的主题模型。
然后,我继续将主题与一些感兴趣的文档级协变量进行比较,只是为了了解这stm允许您使用感兴趣的文档级协变量来估计模型。
我已成功将 my 转换dtm为dfminquanteda并希望dfm在转换为 a 之前将我的协变量添加到stm.
我有一个data.frame与我感兴趣的协变量,它们row.id与dfm.
我正在寻找一种解决方案,将 的协变量data.frame与dfm.
我努力了:
docvars并无济于事metadoc。quanteda
例如,
docvars(dfm, docnames(dfm)) <- df$covariate
任何帮助将不胜感激!